OpenAI推出Sora：文字秒變超現(xiàn)實(shí)視頻，AI視頻時(shí)代來(lái)臨

檸萌 ? 2024年2月18日 09:44:00 ? AI

在人工智能領(lǐng)域，OpenAI再次引領(lǐng)潮流。近日，這家位于美國(guó)舊金山的公司推出了名為Sora的文本到視頻模型，這一創(chuàng)新技術(shù)將文字迅速轉(zhuǎn)化為超現(xiàn)實(shí)的視頻，標(biāo)志著AI視頻時(shí)代的正式到來(lái)。

Sora模型目前僅供專家和創(chuàng)意人士使用，以收集更多反饋并不斷完善。與谷歌的Lumiere等文本轉(zhuǎn)視頻工具相比，Sora在生成視頻的長(zhǎng)度和內(nèi)容復(fù)雜度上都具有顯著優(yōu)勢(shì)。它可以生成長(zhǎng)達(dá)1分鐘的視頻，包含詳細(xì)的場(chǎng)景和多個(gè)角色，為創(chuàng)作者提供了更廣闊的想象空間。

隨著OpenAI、谷歌、微軟等公司紛紛涉足文本到視頻領(lǐng)域，生成式人工智能的競(jìng)爭(zhēng)愈發(fā)激烈。在這一背景下，Sora的推出無(wú)疑為OpenAI贏得了更多關(guān)注。該公司自2015年底成立以來(lái)，一直致力于創(chuàng)建造福全人類的安全通用人工智能（AGI）。如今，隨著Sora的問(wèn)世，OpenAI在這一目標(biāo)上又邁出了堅(jiān)實(shí)的一步。

Sora的獨(dú)特之處在于其強(qiáng)大的文本解析能力，能夠處理長(zhǎng)達(dá)135個(gè)單詞的提示。這使得創(chuàng)作者可以通過(guò)簡(jiǎn)單的文字描述，生成出豐富多樣的視頻內(nèi)容。從人物、動(dòng)物到城市景觀、自然風(fēng)光，甚至包括淹沒在水下的紐約市等超現(xiàn)實(shí)場(chǎng)景，Sora都能輕松呈現(xiàn)。

這一成就的背后，離不開OpenAI在Dall-E和GPT模型研究方面的深厚積累。作為文本到圖像生成器的Dall-E 3于今年9月發(fā)布，而GPT-4 Turbo也在11月推出。Sora借鑒了Dall-E 3的重述技術(shù)，為視覺訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)題，從而提高了視頻生成的準(zhǔn)確性和逼真度。

然而，盡管Sora在技術(shù)上取得了顯著突破，但OpenAI仍坦誠(chéng)地承認(rèn)其存在的弱點(diǎn)。例如，模型在描述復(fù)雜場(chǎng)景的物理原理和因果關(guān)系方面仍有待提高。此外，Sora在區(qū)分左右和處理名人肖像等方面也存在一定的挑戰(zhàn)。

為了確保Sora的廣泛應(yīng)用能夠帶來(lái)積極的社會(huì)影響，OpenAI表示將采取一系列安全措施。這包括滿足公司現(xiàn)有的安全標(biāo)準(zhǔn)，禁止極端暴力、性內(nèi)容、仇恨圖像等不適宜內(nèi)容。同時(shí)，OpenAI也強(qiáng)調(diào)，從現(xiàn)實(shí)世界的使用中學(xué)習(xí)是創(chuàng)建越來(lái)越安全的人工智能系統(tǒng)的關(guān)鍵。因此，該公司計(jì)劃與全球各地的政策制定者、教育工作者和藝術(shù)家合作，了解他們對(duì)Sora的看法和擔(dān)憂，以便不斷完善和優(yōu)化模型。

總之，Sora的推出為人工智能領(lǐng)域帶來(lái)了新的里程碑。它不僅展示了OpenAI在生成式AI技術(shù)上的領(lǐng)先地位，更預(yù)示著AI視頻時(shí)代的來(lái)臨。隨著技術(shù)的不斷發(fā)展和完善，我們有理由相信，未來(lái)的視頻創(chuàng)作將更加依賴于人工智能的力量。而在這個(gè)過(guò)程中，OpenAI將繼續(xù)扮演著舉足輕重的角色。

原創(chuàng)文章，作者：檸萌，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.2079x.cn/article/630509.html

AI AI視頻 OpenAI openai 文本轉(zhuǎn)視頻 OpenAl Sora 人工智能人工智能gpt 人工智能時(shí)代與人類未來(lái)人工智能機(jī)器人人工智能的未來(lái)人工智能聊天開放式職業(yè)開放聊天室開放視頻打開索拉視頻OpenAI Sora

檸萌管理團(tuán)隊(duì)

0 0

新聞

?Alphabet：谷歌將對(duì)在線搜索反壟斷裁決提升上訴

谷歌母公司Alphabet于6月1日宣布，將對(duì)美國(guó)華盛頓地區(qū)法院法官阿米特·梅塔（Amit Mehta）作出的反壟斷裁決提出上訴。該裁決要求谷歌恢復(fù)在線搜索領(lǐng)域的競(jìng)爭(zhēng)，但未采納美國(guó)…

Google
20小時(shí)前
AI

?Meta發(fā)布Multi-SpatialMLLM模型，實(shí)現(xiàn)動(dòng)態(tài)場(chǎng)景精準(zhǔn)解析

Meta公司于5月28日發(fā)布革命性多模態(tài)大模型Multi-SpatialMLLM，通過(guò)整合深度感知、視覺對(duì)應(yīng)和動(dòng)態(tài)感知三大核心組件，成功突破傳統(tǒng)單幀圖像分析的局限性。該模型由Met…

AI
3天前
AI

DeepSeek R1模型已完成小版本試升級(jí)：”深度思考”功能優(yōu)化提升

近日，人工智能領(lǐng)域DeepSeek R1模型已完成小版本試升級(jí)，用戶可通過(guò)官方網(wǎng)頁(yè)、移動(dòng)APP及微信小程序即刻體驗(yàn)新版本，同時(shí)API接口與調(diào)用方式保持完全兼容。此次升級(jí)延續(xù)了該團(tuán)隊(duì)…

AI
3天前
AI

日本出臺(tái)首部人工智能法：可對(duì)違規(guī)企業(yè)實(shí)施名稱公示等懲戒

日本參議院于5月28日表決通過(guò)該國(guó)首部人工智能專門法律《人工智能相關(guān)技術(shù)研究開發(fā)及應(yīng)用推進(jìn)法》，標(biāo)志著日本在AI治理領(lǐng)域邁出關(guān)鍵一步。這部法律以促進(jìn)AI技術(shù)研發(fā)與防范濫用風(fēng)險(xiǎn)為雙重…

AI
4天前
AI

OpenAI計(jì)劃2026年發(fā)布ChatGPT全方位生活助手

今日，外媒bleepingcomputer發(fā)布了一篇引人關(guān)注的報(bào)道。據(jù)稱，OpenAI公司正在緊鑼密鼓地籌備一款由ChatGPT驅(qū)動(dòng)的新產(chǎn)品，計(jì)劃在2026年正式推出。這款產(chǎn)品的目…

AI
5天前
AI

?OpenAI模型被曝?zé)o視關(guān)機(jī)指令研究揭示AI潛在失控風(fēng)險(xiǎn)

近日，一項(xiàng)由Palisade Research主導(dǎo)的實(shí)驗(yàn)首次發(fā)現(xiàn)，部分AI模型竟能突破人類設(shè)定的關(guān)機(jī)指令。測(cè)試中，研究人員讓多個(gè)主流AI模型解答數(shù)學(xué)題，當(dāng)?shù)谌齻€(gè)問(wèn)題結(jié)束后系統(tǒng)發(fā)出“…

AI
6天前
AI

Claude 4系列怎么樣？七小時(shí)連續(xù)編程創(chuàng)紀(jì)錄?

昨日，人工智能企業(yè)Anthropic正式發(fā)布Claude 4系列大模型，包含Opus 4與Sonnet 4雙版本。那么Claude 4怎么樣呢？下面就為大家詳細(xì)介紹下。據(jù)了解，C…

AI
2025年5月23日
新聞

?OpenAI“星際之門”首個(gè)海外基地落成全球AI基建角逐再升級(jí)

OpenAI聯(lián)合阿聯(lián)酋科技集團(tuán)G42、甲骨文、英偉達(dá)等六家巨頭宣布啟動(dòng)“星際之門阿聯(lián)酋”（Stargate UAE）項(xiàng)目，標(biāo)志著其人工智能基礎(chǔ)設(shè)施平臺(tái)首次走出美國(guó)。該項(xiàng)目作為“Op…

AI
2025年5月23日
AI

傳聞?Anthropic最強(qiáng)AI模型Claude 4系列將明日登場(chǎng)

Anthropic官方宣布將于太平洋時(shí)間5月22日9點(diǎn)30分（北京時(shí)間5月23日0點(diǎn)30分）舉辦“Code with Claude”發(fā)布會(huì)，據(jù)外媒曝光的官網(wǎng)配置文件顯示，全新Cla…

AI
2025年5月22日
商業(yè)

?OpenAI宣布65億美元收購(gòu)Jony Ive初創(chuàng)公司io

OpenAI于5月22日宣布以65億美元全股票收購(gòu)前蘋果首席設(shè)計(jì)官Jony Ive創(chuàng)立的AI設(shè)備公司io，創(chuàng)下該公司史上最大并購(gòu)記錄。此次交易不僅整合了io團(tuán)隊(duì)55名硬件工程師及制…

李小白
2025年5月22日
新聞

Skyvast助力海外中國(guó)云引發(fā)馬來(lái)西亞成中美AI博弈新戰(zhàn)場(chǎng)

當(dāng)?shù)貢r(shí)間5月19日，馬來(lái)西亞原計(jì)劃部署華為昇騰GPU驅(qū)動(dòng)的AI服務(wù)器，并引入中國(guó)初創(chuàng)公司DeepSeek的大語(yǔ)言模型（LLM）。然而，項(xiàng)目公布僅24小時(shí)后即被撤回，表面未作解釋的背…

NEWS
2025年5月22日
AI

如何辨別AI生成的圖片文字聲音？三招識(shí)破AI造假！

數(shù)字時(shí)代AI生成的圖片文字聲音鋪天蓋地，讓人真假分不清，那么如何辨別AI生成的圖片文字聲音？小編整理出一份實(shí)用鑒別手冊(cè)。只需掌握以下技巧，普通人也能揪出AI生成的”蛛絲…

AI
2025年5月20日
AI

OpenAI ChatGPT上線“錄音速記”功能

近日，科技博主@M1Astra在社交平臺(tái)X爆料稱，OpenAI正測(cè)試一款名為“Record”的會(huì)議輔助工具，或?qū)⒅苯又踩隒hatGPT。這一功能瞄準(zhǔn)線上會(huì)議場(chǎng)景，用戶只需按住按鈕說(shuō)…

AI
2025年5月16日
商業(yè)

英偉達(dá)對(duì)CoreWeave持股7%，AI算力合作再加碼

英偉達(dá)最新披露的監(jiān)管文件顯示，今年一季度其持有的云計(jì)算服務(wù)商CoreWeave股份比例從上一季度的5.2%提升至7%。這一動(dòng)作與CoreWeave近期高調(diào)宣布的AI算力合作計(jì)劃緊密…

泡沫大盜
2025年5月16日
AI

OpenAI 上線安全評(píng)估中心，定期公開 AI 模型評(píng)估結(jié)果以提升透明度

OpenAI 將公開內(nèi)部人工智能模型安全評(píng)估結(jié)果，以提高透明度。安全評(píng)估中心將展示模型在有害內(nèi)容生成、模型越獄以及幻覺現(xiàn)象等方面的測(cè)試表現(xiàn)。OpenAI 旨在支持透明度，發(fā)布更多評(píng)估項(xiàng)目。

好奇寶寶
2025年5月15日
AI

OpenAI 升級(jí) ChatGPT AI 聊天機(jī)器人，GPT-4.1 編程專家模型登場(chǎng)

OpenAI在X平臺(tái)上發(fā)布ChatGPT AI聊天機(jī)器人中引入GPT-4.1模型，特別擅長(zhǎng)處理編程任務(wù)，提高效率，性能與最新版GPT-4o相當(dāng)，更全面提升。

李森
2025年5月15日
AI

ChatGPT Deep Research如何重塑開發(fā)者工作流？一文幫你梳理清晰

在軟件開發(fā)領(lǐng)域，理解復(fù)雜代碼庫(kù)一直是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。傳統(tǒng)方式下，開發(fā)者需要耗費(fèi)數(shù)天甚至數(shù)周時(shí)間逐行閱讀代碼、梳理架構(gòu)邏輯。然而，OpenAI最新推出的ChatGPT Deep…

潮玩君
2025年5月15日
新聞

?微軟發(fā)布Win11 Dev 26200.5600預(yù)覽版更新：智能文本功能“Click to Do”上線

昨日晚間，微軟給開發(fā)者用戶派發(fā)了一份“智能大禮包”——Windows 11 Dev頻道用戶現(xiàn)在可以升級(jí)到Build 26200.5600預(yù)覽版，其中最搶眼的功能是?“點(diǎn)一下就能讓文…

Microsoft
2025年5月13日
商業(yè)

?臺(tái)積電4月銷售額同比飆升48%，創(chuàng)近三年新高

全球半導(dǎo)體代工龍頭臺(tái)積電今日公布2025年4月運(yùn)營(yíng)數(shù)據(jù)：當(dāng)月銷售額達(dá)3495.67億新臺(tái)幣（約合837億元人民幣），較去年同期激增48.1%，環(huán)比增長(zhǎng)22.2%。這一單月增幅創(chuàng)下近…

若安丶
2025年5月9日
商業(yè)

?馬斯克旗下xAI新一輪融資或?qū)_刺1200億美元估值逼近OpenAI

據(jù)知情人士今日透露，特斯拉CEO埃隆·馬斯克創(chuàng)立的AI公司xAI正啟動(dòng)新一輪融資談判，潛在xAI估值或達(dá)1200億美元（約合8687億元人民幣），成為全球估值第二高的人工智能企業(yè)，…

商業(yè)頭條
2025年5月9日