OpenAI推出Sora:文字秒變超現(xiàn)實(shí)視頻,AI視頻時(shí)代來臨

OpenAI推出Sora:文字秒變超現(xiàn)實(shí)視頻,AI視頻時(shí)代來臨

人工智能領(lǐng)域,OpenAI再次引領(lǐng)潮流。近日,這家位于美國舊金山的公司推出了名為Sora的文本到視頻模型,這一創(chuàng)新技術(shù)將文字迅速轉(zhuǎn)化為超現(xiàn)實(shí)的視頻,標(biāo)志著AI視頻時(shí)代的正式到來。

Sora模型目前僅供專家和創(chuàng)意人士使用,以收集更多反饋并不斷完善。與谷歌的Lumiere等文本轉(zhuǎn)視頻工具相比,Sora在生成視頻的長度和內(nèi)容復(fù)雜度上都具有顯著優(yōu)勢。它可以生成長達(dá)1分鐘的視頻,包含詳細(xì)的場景和多個(gè)角色,為創(chuàng)作者提供了更廣闊的想象空間。

隨著OpenAI、谷歌、微軟等公司紛紛涉足文本到視頻領(lǐng)域,生成式人工智能的競爭愈發(fā)激烈。在這一背景下,Sora的推出無疑為OpenAI贏得了更多關(guān)注。該公司自2015年底成立以來,一直致力于創(chuàng)建造福全人類的安全通用人工智能(AGI)。如今,隨著Sora的問世,OpenAI在這一目標(biāo)上又邁出了堅(jiān)實(shí)的一步。

Sora的獨(dú)特之處在于其強(qiáng)大的文本解析能力,能夠處理長達(dá)135個(gè)單詞的提示。這使得創(chuàng)作者可以通過簡單的文字描述,生成出豐富多樣的視頻內(nèi)容。從人物、動(dòng)物到城市景觀、自然風(fēng)光,甚至包括淹沒在水下的紐約市等超現(xiàn)實(shí)場景,Sora都能輕松呈現(xiàn)。

這一成就的背后,離不開OpenAI在Dall-E和GPT模型研究方面的深厚積累。作為文本到圖像生成器的Dall-E 3于今年9月發(fā)布,而GPT-4 Turbo也在11月推出。Sora借鑒了Dall-E 3的重述技術(shù),為視覺訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)題,從而提高了視頻生成的準(zhǔn)確性和逼真度。

然而,盡管Sora在技術(shù)上取得了顯著突破,但OpenAI仍坦誠地承認(rèn)其存在的弱點(diǎn)。例如,模型在描述復(fù)雜場景的物理原理和因果關(guān)系方面仍有待提高。此外,Sora在區(qū)分左右和處理名人肖像等方面也存在一定的挑戰(zhàn)。

為了確保Sora的廣泛應(yīng)用能夠帶來積極的社會(huì)影響,OpenAI表示將采取一系列安全措施。這包括滿足公司現(xiàn)有的安全標(biāo)準(zhǔn),禁止極端暴力、性內(nèi)容、仇恨圖像等不適宜內(nèi)容。同時(shí),OpenAI也強(qiáng)調(diào),從現(xiàn)實(shí)世界的使用中學(xué)習(xí)是創(chuàng)建越來越安全的人工智能系統(tǒng)的關(guān)鍵。因此,該公司計(jì)劃與全球各地的政策制定者、教育工作者和藝術(shù)家合作,了解他們對Sora的看法和擔(dān)憂,以便不斷完善和優(yōu)化模型。

總之,Sora的推出為人工智能領(lǐng)域帶來了新的里程碑。它不僅展示了OpenAI在生成式AI技術(shù)上的領(lǐng)先地位,更預(yù)示著AI視頻時(shí)代的來臨。隨著技術(shù)的不斷發(fā)展和完善,我們有理由相信,未來的視頻創(chuàng)作將更加依賴于人工智能的力量。而在這個(gè)過程中,OpenAI將繼續(xù)扮演著舉足輕重的角色。

原創(chuàng)文章,作者:檸萌,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/630509.html

檸萌的頭像檸萌管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論