
近日,谷歌正式為Gemini人工智能助手上線基于Veo 3模型的圖像轉視頻功能,用戶只需上傳靜態(tài)照片并添加文本描述,即可生成帶音效的8秒動態(tài)短視頻。該功能現(xiàn)已面向AI Ultra和AI Pro訂閱用戶開放,首階段登陸Gemini網(wǎng)頁版,移動端應用將于本周內(nèi)全面推送。
操作流程極為簡潔:用戶點擊提示欄的”工具”選擇”視頻”入口,上傳照片后通過文本指令描述動態(tài)效果,例如”海浪拍打礁石”或”人物轉頭微笑”。創(chuàng)新性在于支持三層音頻同步——可添加背景音樂(如雨聲)、環(huán)境增強音效(如樹葉沙沙聲)甚至人物對白,系統(tǒng)通過Veo 3獨有的波形匹配技術確??谛团c語音精準同步。最終輸出720p分辨率、16:9橫屏的MP4格式視頻,并自動添加可見AI水印及隱藏式數(shù)字標識。
此次升級標志著谷歌在AI視頻賽道的關鍵突破。Veo 3模型采用幀間運動預測算法,大幅提升生成畫面的物理真實感,使Gemini具備與OpenAI、Runway等對手同臺競技的影視創(chuàng)作能力。值得關注的是,該功能直接集成在Gemini交互界面,相較此前需通過獨立工具Flow操作的模式,顯著降低了創(chuàng)作門檻。
原創(chuàng)文章,作者:Google,如若轉載,請注明出處:http://m.2079x.cn/article/727672.html