在2025年I/O開發(fā)者大會上,谷歌震撼發(fā)布新一代AI視頻生成模型Veo 3,標志著其在生成式AI領域的又一次重大突破。該模型不僅繼承了前代產(chǎn)品的核心優(yōu)勢,更實現(xiàn)了音視頻一體化生成的突破性進展,成為首個能夠同步生成高質(zhì)量視頻與適配音效的商業(yè)化AI工具。

Veo 3支持用戶通過文本或圖像提示快速生成專業(yè)級視頻內(nèi)容,并可根據(jù)場景需求自動匹配環(huán)境音效。無論是人物對話、自然聲響還是復雜的城市交通音效,系統(tǒng)均能實現(xiàn)精準同步,顯著提升視頻的真實感和沉浸感。谷歌DeepMind產(chǎn)品副總裁Eli Collins對Veo 3的表現(xiàn)給予高度評價,他指出:"Veo 3在物理效果模擬、人物唇形同步等關鍵技術指標上已達到行業(yè)領先水平。通過持續(xù)優(yōu)化算法,我們成功解決了音畫不同步的行業(yè)痛點。"
目前,Veo 3主要面向美國地區(qū)的Gemini Ultra訂閱用戶開放,訂閱費用為每月249.99美元。此外,企業(yè)用戶可通過谷歌Vertex AI平臺獲取定制化服務,滿足商業(yè)級視頻創(chuàng)作需求。在本次發(fā)布會上,谷歌還同步推出了升級版的Imagen 4圖像生成模型及電影制作輔助工具Flow。值得注意的是,谷歌針對Veo 2進行了功能迭代,新增了基于文本提示的物體增刪功能,進一步擴展了視頻編輯的可能性。
盡管近年來谷歌在生成式AI領域動作頻頻,但其2024年因Imagen 3模型生成歷史錯誤圖像而引發(fā)的風波仍歷歷在目。對此,谷歌聯(lián)合創(chuàng)始人Sergey Brin坦言:"技術進步必須建立在嚴謹?shù)臏y試體系之上。"此次Veo 3的發(fā)布不僅是谷歌技術實力的集中展現(xiàn),更預示著AI視頻創(chuàng)作將邁入音畫協(xié)同的新時代。隨著技術的不斷迭代,我們有理由相信,未來的內(nèi)容創(chuàng)作將更加高效、智能且富有創(chuàng)意。





























浙公網(wǎng)安備 33010502007447號