ChatGPT-4o登頂大模型競(jìng)技場(chǎng)，OpenAI重奪第一寶座

AI ? 2024年11月21日 17:13:00 ? AI

在今日的OpenAI開發(fā)者日新加坡站活動(dòng)中，ChatGPT再次展現(xiàn)了其強(qiáng)大的競(jìng)爭(zhēng)力。最新版本的ChatGPT-4o（以下簡(jiǎn)稱4o）在更新后，成功擊敗了此前排名第一的谷歌Gemini，重新奪回了大模型競(jìng)技場(chǎng)的冠軍寶座。

此次4o的更新主要集中在“創(chuàng)意寫作能力”上。據(jù)OpenAI官方介紹，新版模型能夠完成更自然、更有吸引力、更具針對(duì)性的寫作，文本相關(guān)性和可讀性也得到了顯著提升。此外，4o還能更好地處理上傳的文件，提供更深入的見(jiàn)解和更全面的響應(yīng)。

作為Canvas功能的一部分，OpenAI希望通過(guò)改進(jìn)寫作來(lái)推動(dòng)人機(jī)協(xié)作方式的變革，更具創(chuàng)造性地完成寫作任務(wù)。o1核心貢獻(xiàn)者Karina Nguyen表示，盡管寫作這一研究領(lǐng)域非常主觀且開放，但4o在寫作方面的進(jìn)展是AGI（通用人工智能）創(chuàng)造性智能的關(guān)鍵。

在大模型競(jìng)技場(chǎng)的創(chuàng)意寫作分榜上，新版4o（ChatGPT-4o-1120）的分?jǐn)?shù)從上個(gè)版本的1365提升到了1402，確實(shí)展現(xiàn)出了明顯的提升。而在其他能力分榜上，4o也取得了不俗的成績(jī)。在代碼能力方面，從第2位升至第1位；在數(shù)學(xué)能力方面，從第4位升至第3位；在困難任務(wù)方面，同樣從第2位升至第1位。此外，在風(fēng)格控制分榜上，4o依然位居首位。

在與其他模型的對(duì)比中，新版4o也展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力。在對(duì)上此前登頂?shù)腉emini-Exp-1114時(shí)，勝率為59%；對(duì)上Claude 3.5 Sonnet時(shí)，勝率為69%；而對(duì)上5月版本的4o時(shí)，更是在72%的情況下都能取勝。

然而，盡管4o取得了如此優(yōu)異的成績(jī)，但不少網(wǎng)友仍然對(duì)OpenAI未能推出傳聞中的o1滿血版表示不滿。有人認(rèn)為，OpenAI此次更新4o只是為了奪回競(jìng)技場(chǎng)的第一名，而并非真正滿足用戶的期待。不過(guò)，也有網(wǎng)友對(duì)4o的更新進(jìn)行了認(rèn)真研究，并發(fā)現(xiàn)了其在系統(tǒng)提示詞方面的改進(jìn)，如新增了一道護(hù)欄，確保ChatGPT不在敏感話題上胡說(shuō)八道。

總的來(lái)說(shuō)，ChatGPT-4o的更新無(wú)疑為OpenAI重奪大模型競(jìng)技場(chǎng)的第一寶座增添了新的動(dòng)力。盡管仍有一些用戶對(duì)其未能推出o1滿血版表示不滿，但4o在創(chuàng)意寫作能力等方面的提升仍然值得肯定。未來(lái)，隨著技術(shù)的不斷進(jìn)步和用戶需求的不斷變化，ChatGPT將繼續(xù)努力提升自己的能力，為用戶提供更加優(yōu)質(zhì)、便捷的服務(wù)。

現(xiàn)在，如果你對(duì)新版4o的創(chuàng)意寫作能力感興趣，可以前往大模型競(jìng)技場(chǎng)進(jìn)行免費(fèi)試用。相信你會(huì)被它的強(qiáng)大功能所折服。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.2079x.cn/article/694548.html

AI認(rèn)證作者

0 0

AI

OpenAI計(jì)劃2026年發(fā)布ChatGPT全方位生活助手

今日，外媒bleepingcomputer發(fā)布了一篇引人關(guān)注的報(bào)道。據(jù)稱，OpenAI公司正在緊鑼密鼓地籌備一款由ChatGPT驅(qū)動(dòng)的新產(chǎn)品，計(jì)劃在2026年正式推出。這款產(chǎn)品的目…

AI
3天前
手機(jī)

?谷歌Pixel 10傳聞：或搭載臺(tái)積電3nm芯片與臺(tái)積電鎖定五年合作

今年下半年，谷歌將推出Pixel 10系列手機(jī)，現(xiàn)在關(guān)于谷歌Pixel 10傳聞信息被傳出。據(jù)臺(tái)媒《電子時(shí)報(bào)》報(bào)道，該機(jī)型將首次搭載臺(tái)積電3nm工藝代工的Tensor G5處理器，…

Google
4天前
AI

?OpenAI模型被曝?zé)o視關(guān)機(jī)指令研究揭示AI潛在失控風(fēng)險(xiǎn)

近日，一項(xiàng)由Palisade Research主導(dǎo)的實(shí)驗(yàn)首次發(fā)現(xiàn)，部分AI模型竟能突破人類設(shè)定的關(guān)機(jī)指令。測(cè)試中，研究人員讓多個(gè)主流AI模型解答數(shù)學(xué)題，當(dāng)?shù)谌齻€(gè)問(wèn)題結(jié)束后系統(tǒng)發(fā)出“…

AI
4天前
新聞

?谷歌全面啟用漸變新標(biāo) 已陸續(xù)應(yīng)用更多應(yīng)用程序和網(wǎng)頁(yè)

谷歌在2025年I/O開發(fā)者大會(huì)上發(fā)布的全新“漸變G”logo，現(xiàn)已全面滲透至核心產(chǎn)品生態(tài)。繼上周率先登陸移動(dòng)端Google應(yīng)用后，這一設(shè)計(jì)變革本周正式覆蓋google.com瀏覽…

Google
5天前
新聞

?谷歌AI搜索遭出版商集體控訴流量爭(zhēng)奪戰(zhàn)再升級(jí)

近日，有消息稱，谷歌因新推出的“AI Mode”搜索功能陷入爭(zhēng)議漩渦，新聞/媒體聯(lián)盟（News/Media Alliance）公開譴責(zé)其“盜竊內(nèi)容”，并呼吁司法部介入調(diào)查。在日前召…

Google
2025年5月23日
新聞

?OpenAI“星際之門”首個(gè)海外基地落成全球AI基建角逐再升級(jí)

OpenAI聯(lián)合阿聯(lián)酋科技集團(tuán)G42、甲骨文、英偉達(dá)等六家巨頭宣布啟動(dòng)“星際之門阿聯(lián)酋”（Stargate UAE）項(xiàng)目，標(biāo)志著其人工智能基礎(chǔ)設(shè)施平臺(tái)首次走出美國(guó)。該項(xiàng)目作為“Op…

AI
2025年5月23日
商業(yè)

?OpenAI宣布65億美元收購(gòu)Jony Ive初創(chuàng)公司io

OpenAI于5月22日宣布以65億美元全股票收購(gòu)前蘋果首席設(shè)計(jì)官Jony Ive創(chuàng)立的AI設(shè)備公司io，創(chuàng)下該公司史上最大并購(gòu)記錄。此次交易不僅整合了io團(tuán)隊(duì)55名硬件工程師及制…

李小白
2025年5月22日
新聞

?谷歌Google Play商店更新：主題瀏覽與視頻輪播上線

在2025年谷歌I/O開發(fā)者大會(huì)上，Google Play應(yīng)用商店迎來(lái)近年來(lái)最重磅的功能升級(jí)。此次更新聚焦用戶體驗(yàn)優(yōu)化與開發(fā)者收益提升雙重目標(biāo)，核心舉措包括上線“主題瀏覽頁(yè)面”（T…

Google
2025年5月21日
新聞

?安卓16 Beta版解鎖鎖屏新玩法：字體粗細(xì)寬度自由調(diào)節(jié)

有消息稱，谷歌在5月21日發(fā)布的安卓16 QPR1 Beta 1測(cè)試版中，為鎖屏界面帶來(lái)突破性更新，首次允許用戶通過(guò)滑動(dòng)條自定義時(shí)鐘字體的粗細(xì)（weight）和寬度（width）。…

Android
2025年5月21日
AI

?谷歌Imagen 4文生圖模型亮相Google I/O大會(huì)：速度提升10倍，支持海報(bào)級(jí)排版設(shè)計(jì)

谷歌在2025年I/O開發(fā)者大會(huì)上正式推出全新文生圖AI模型Imagen 4，其生成速度較前代提升10倍，并顯著優(yōu)化了圖像細(xì)節(jié)與文字渲染能力。官方演示顯示，新模型生成的圖像在毛發(fā)、…

Google
2025年5月21日
AI

?谷歌I/O開發(fā)者大會(huì)：Gemini 2.5系列大模型發(fā)布，輕量級(jí)Flash 6月上線

在2025年谷歌I/O開發(fā)者大會(huì)上，谷歌正式宣布Gemini 2.5系列大模型的最新進(jìn)展。作為兩大核心產(chǎn)品，輕量級(jí)模型Gemini 2.5 Flash將于6月初開放常規(guī)使用版本，而…

Google
2025年5月21日
新聞

?谷歌I/O開發(fā)者大會(huì)：正式發(fā)布視頻生成模型Veo3，AI音畫同步突破

在2025年谷歌I/O開發(fā)者大會(huì)上，新一代視頻生成模型Veo3正式亮相，首次實(shí)現(xiàn)背景音效與畫面的AI同步生成。該模型不僅能根據(jù)文本提示合成動(dòng)態(tài)場(chǎng)景，還能為鳥鳴、交通等環(huán)境音效匹配畫…

Google
2025年5月21日
新聞

Google I/O 2025 大會(huì)一文讀懂！8 款顛覆性 AI 功能重塑未來(lái)科技生活 ?

5 月 21 日，在美國(guó)加州山景城舉行的 Google I/O 2025 開發(fā)者大會(huì)上，谷歌以“AI 賦能萬(wàn)物”為主題，揭曉了涵蓋搜索、辦公、創(chuàng)作、購(gòu)物等領(lǐng)域的數(shù)十項(xiàng)人工智能創(chuàng)新。…

科技探索者
2025年5月21日
新聞

谷歌2025 Google I/O 前瞻? 多終端 Gemini 落地細(xì)節(jié)曝光 ?

5月19日，在周二Google I/O開發(fā)者大會(huì)開幕前夕，谷歌通過(guò)一場(chǎng)Android Show活動(dòng)率先引爆人工智能領(lǐng)域的焦點(diǎn)：Gemini 助手將全面登陸 Wear OS 智能手表…

潮玩君
2025年5月19日
AI

實(shí)測(cè)OpenAI 的GPT-4.1性能表現(xiàn)如何？GPT-4.1為何重要

5月19日，OpenAI 宣布，將其最新大型語(yǔ)言模型 GPT-4.1 正式集成至 ChatGPT 的付費(fèi)訂閱服務(wù)（包括 Plus、Pro 和 Team 版本）。此前，該模型僅面向開…

科技探索者
2025年5月19日
新聞

?消息稱谷歌AR眼鏡將于I/O開發(fā)者大會(huì)首發(fā)亮相

北京時(shí)間5月21日凌晨1點(diǎn)，谷歌將正式召開2025年度I/O開發(fā)者大會(huì)。據(jù)媒體消息，谷歌首款A(yù)R眼鏡將在本次大會(huì)上首次公開，產(chǎn)品搭載Android XR系統(tǒng)，最快于2025年下半年…

Google
2025年5月19日
AI

OpenAI ChatGPT上線“錄音速記”功能

近日，科技博主@M1Astra在社交平臺(tái)X爆料稱，OpenAI正測(cè)試一款名為“Record”的會(huì)議輔助工具，或?qū)⒅苯又踩隒hatGPT。這一功能瞄準(zhǔn)線上會(huì)議場(chǎng)景，用戶只需按住按鈕說(shuō)…

AI
2025年5月16日
商業(yè)

美股科技七巨頭“熄火” 黃金大反彈

當(dāng)?shù)貢r(shí)間5月15日，美股三大指數(shù)漲跌互現(xiàn)：道瓊斯指數(shù)上漲0.65%至42,322.75點(diǎn)，標(biāo)普500指數(shù)微漲0.41%至5,916.93點(diǎn)，創(chuàng)3月3日以來(lái)新高，納斯達(dá)克指數(shù)則結(jié)束六…

商業(yè)頭條
2025年5月16日
AI

OpenAI 上線安全評(píng)估中心，定期公開 AI 模型評(píng)估結(jié)果以提升透明度

OpenAI 將公開內(nèi)部人工智能模型安全評(píng)估結(jié)果，以提高透明度。安全評(píng)估中心將展示模型在有害內(nèi)容生成、模型越獄以及幻覺(jué)現(xiàn)象等方面的測(cè)試表現(xiàn)。OpenAI 旨在支持透明度，發(fā)布更多評(píng)估項(xiàng)目。

好奇寶寶
2025年5月15日
新聞

谷歌 Android Auto 新特性：調(diào)整播放器控件布局、優(yōu)化游戲顯示

谷歌優(yōu)化Android Auto，調(diào)整游戲顯示方式，將播放/暫停按鈕位置對(duì)調(diào)，增加觸控區(qū)域，減少誤觸風(fēng)險(xiǎn)。

檸萌
2025年5月15日