OpenAI官宣最強(qiáng)模型o3-pro!號(hào)稱寫作、編程更準(zhǔn)

6月11日,OpenAI發(fā)布了o3-pro,這一AI模型被公司稱為迄今為止最強(qiáng)大的產(chǎn)品。o3-pro是OpenAI今年早些時(shí)候推出的推理模型o3的一個(gè)版本。與傳統(tǒng)AI模型不同,推理模型能夠逐步推理解決問(wèn)題,因此在物理、數(shù)學(xué)和編程等領(lǐng)域表現(xiàn)更為可靠。

OpenAI官宣最強(qiáng)模型o3-pro!號(hào)稱寫作、編程更準(zhǔn)

自本周二起,o3-pro已面向ChatGPT Pro和Team用戶開(kāi)放,取代原有的o1-pro模型。OpenAI表示,企業(yè)版與教育版用戶將在下周獲得訪問(wèn)權(quán)限。o3-pro也已于今日上線OpenAI的開(kāi)發(fā)者API。

在API中,o3-pro的定價(jià)為每百萬(wàn)輸入tokens 20美元,每百萬(wàn)輸出tokens 80美元。輸入tokens指輸入到模型中的內(nèi)容,輸出tokens則是模型基于輸入生成的內(nèi)容。

OpenAI在更新日志中寫道:“在專家評(píng)測(cè)中,評(píng)審人員在所有測(cè)試類別中均更傾向于o3-pro,尤其是在科學(xué)、教育、編程、商務(wù)和寫作輔助等關(guān)鍵領(lǐng)域。評(píng)審人員還一致認(rèn)為,o3-pro在表達(dá)清晰度、內(nèi)容全面性、指令遵循度和準(zhǔn)確性等方面表現(xiàn)更優(yōu)?!?/p>

根據(jù)OpenAI介紹,o3-pro具備多項(xiàng)工具調(diào)用能力,可實(shí)現(xiàn)網(wǎng)頁(yè)搜索、文件分析、圖像內(nèi)容推理、使用Python、借助記憶進(jìn)行個(gè)性化響應(yīng)等。不過(guò),OpenAI也指出,相較于o1-pro,o3-pro生成回復(fù)所需時(shí)間通常更長(zhǎng)。

o3-pro還存在其他限制。目前,ChatGPT中的臨時(shí)對(duì)話功能暫時(shí)關(guān)閉,OpenAI正在解決相關(guān)技術(shù)問(wèn)題。o3-pro不支持圖像生成,也無(wú)法用于“畫(huà)布”(Canvas)這一AI智能工作區(qū)功能。

值得一提的是,OpenAI內(nèi)部測(cè)試顯示,o3-pro在多項(xiàng)主流AI基準(zhǔn)測(cè)試中取得了優(yōu)異成績(jī)。在AIME 2024數(shù)學(xué)能力評(píng)測(cè)中,o3-pro得分高于谷歌的旗艦AI模型Gemini 2.5 Pro。在GPQA Diamond(博士級(jí)科學(xué)知識(shí)測(cè)試)中,o3-pro也超越了Anthropic近期發(fā)布的Claude 4 Opus。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.2079x.cn/article/723322.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論