?谷歌I/O開發(fā)者大會:正式發(fā)布視頻生成模型Veo3,AI音畫同步突破

?谷歌I/O開發(fā)者大會:正式發(fā)布視頻生成模型Veo3,AI音畫同步突破

在2025年谷歌I/O開發(fā)者大會上,新一代視頻生成模型Veo3正式亮相,首次實現(xiàn)背景音效與畫面的AI同步生成。該模型不僅能根據(jù)文本提示合成動態(tài)場景,還能為鳥鳴、交通等環(huán)境音效匹配畫面,甚至生成人物對話時的精準(zhǔn)口型動作。相較于前代產(chǎn)品,Veo3在物理模擬和口型同步技術(shù)上取得顯著突破,其生成的1080P高清視頻時長可達60秒以上,并能理解“航拍”“延時攝影”等專業(yè)影視術(shù)語。

目前,Veo3已面向美國地區(qū)的Gemini Ultra訂閱用戶及Vertex AI企業(yè)客戶開放,并集成至谷歌影視制作平臺Flow中。借助Flow工具,創(chuàng)作者可上傳人物、場景圖片作為參考,通過鏡頭控制功能實現(xiàn)畫面旋轉(zhuǎn)、縮放及橫豎屏切換,甚至動態(tài)增減視頻元素。與此同時,前代Veo2的基礎(chǔ)功能仍向所有用戶開放,保留了圖像參考和鏡頭調(diào)整等創(chuàng)作自由。

針對日益嚴峻的AI內(nèi)容識別難題,谷歌同步推出了SynthID Detector檢測工具。用戶上傳文件即可識別是否包含加密水印,該技術(shù)已應(yīng)用于部分生成模型,但尚未實現(xiàn)全平臺覆蓋。隨著Veo3的推出,谷歌在AI視頻生成領(lǐng)域的技術(shù)優(yōu)勢進一步擴大,其與Runway、OpenAI等企業(yè)的競爭也步入新階段。

原創(chuàng)文章,作者:Google,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/719958.html

Google的頭像Google認證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論