?OpenAI推出“全能助手”o3和o4-mini:自動調(diào)用工具解題,編程競賽進全球前200

?OpenAI推出“全能助手”o3和o4-mini:自動調(diào)用工具解題,編程競賽進全球前200

今日,OpenAI正式發(fā)布新一代多模態(tài)推理模型o3和o4-mini,首次實現(xiàn)智能調(diào)用并組合ChatGPT全功能工具鏈,包括網(wǎng)頁搜索、Python數(shù)據(jù)分析、圖像深度推理及文生圖等能力。兩款模型可自主判斷工具使用場景,通過結(jié)構化輸出解決復雜問題,被開發(fā)者稱為“AI工具組合大師”。

技術細節(jié)顯示,o4-mini在多領域測試中表現(xiàn)亮眼:其數(shù)學推理能力在AIME 2024/2025測試中分別達到93.4%和92.7%準確率,編程競賽得分2700分(Codeforces全球前200名水平),科學推理準確率較前代提升35%。該模型采用創(chuàng)新訓練方法,不僅學習文本生成,更掌握調(diào)用計算器、圖像處理工具等外部程序完成特定任務的能力。例如面對復雜數(shù)學題時,可自動調(diào)用計算模塊;處理圖像數(shù)據(jù)時,能啟動裁剪、旋轉(zhuǎn)等預處理程序。

安全管控方面,OpenAI同步推出“安全導向推理監(jiān)控系統(tǒng)”,重點防范模型在生物、化學等敏感領域提供風險建議。該系統(tǒng)通過1000小時紅隊測試,可識別并攔截涉及生物威脅的提問。

此次發(fā)布的兩款模型突破傳統(tǒng)文本交互局限,實現(xiàn)多模態(tài)深度協(xié)同。用戶上傳旅行照片時,模型可調(diào)用視覺分析模塊識別地貌特征,結(jié)合地理數(shù)據(jù)庫生成圖文報告;處理企業(yè)流程圖時,能聯(lián)動圖表生成工具自動優(yōu)化排版。開發(fā)者強調(diào),o4-mini激活成本較同類模型降低50%,API響應速度達20毫秒級。

目前,o3和o4-mini已集成至ChatGPT的“深度研究”功能,支持實時網(wǎng)絡檢索與研究報告編譯。OpenAI CEO奧爾特曼透露,該系列模型是通向GPT-5的關鍵過渡產(chǎn)品,未來數(shù)月將推出更強大的迭代版本。

即日起,企業(yè)用戶可通過OpenAI平臺申請接入新模型API,個人用戶可在ChatGPT工具集中體驗部分功能。隨著工具調(diào)用能力的開放,AI助手正從“信息提供者”轉(zhuǎn)型為“問題終結(jié)者”,開啟智能體應用新紀元。

原創(chuàng)文章,作者:聆聽,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/715303.html

聆聽的頭像聆聽認證作者

相關推薦

發(fā)表回復

登錄后才能評論