OpenAI SearchGPT 官方演示大翻車，源代碼竟暴露搜索機(jī)制

科技探索者 ? 2024年7月29日 12:19:00 ? AI

SearchGPT 發(fā)布剛過(guò)兩天，已有人灰度測(cè)試到了。今天，網(wǎng)友 Kesku 自制的 demo 全網(wǎng)刷屏，SearchGPT 結(jié)果輸出如此神速，讓所有人為之震驚。

但另一方面，OpenAI 當(dāng)天放出的官方演示，被外媒《大西洋月刊》曝出其中的問(wèn)題。在回答「8 月在北卡羅來(lái)納 Boone 舉辦的音樂(lè)節(jié)」的問(wèn)題時(shí)，SearchGPT 竟弄錯(cuò)時(shí)間，出現(xiàn)了幻覺。

OpenAI 發(fā)言人 Kayla Wood 已經(jīng)向《大西洋月刊》承認(rèn)了這個(gè)錯(cuò)誤，并表示「這僅是初始的原型，我們將不斷改進(jìn)?！?/p>

這個(gè)錯(cuò)誤讓人不禁想起 Bard 曾經(jīng)造成的慘劇。

2023 年 2 月，谷歌推出了這個(gè)聊天機(jī)器人產(chǎn)品以對(duì)抗 ChatGPT，但首次亮相就出現(xiàn)了事實(shí)性錯(cuò)誤，導(dǎo)致 Alphabet 股價(jià)當(dāng)天暴跌 9%，市值瞬間蒸發(fā) 1000 億美元。

Bard 稱 James Webb 太空望遠(yuǎn)鏡拍攝了系外行星的第一張照片，但實(shí)際上這個(gè)功績(jī)屬于歐洲南部天文臺(tái)的 VLT

但好在，OpenAI 沒(méi)有股價(jià)可跌，而且僅開放內(nèi)測(cè)的做法也是相當(dāng)謹(jǐn)慎。畢竟有谷歌的前車之鑒，可以預(yù)料到，LLM 這種錯(cuò)誤幾乎是無(wú)法避免的。

即使 OpenAI 能夠找到方法大幅減少 SearchGPT 的幻覺，但面對(duì)龐大的訪問(wèn)量也是「杯水車薪」。

假設(shè)幻覺率僅為 1%（這個(gè)比率很難達(dá)到），按照谷歌的規(guī)模，也會(huì)導(dǎo)致每天產(chǎn)生數(shù)千萬(wàn)個(gè)錯(cuò)誤答案。

更何況，我們目前還沒(méi)有發(fā)現(xiàn)足夠可靠且有效的方法，來(lái)消除 LLM 的廢話和幻覺。

而且，Andrej Karpathy 大佬曾經(jīng)在推特上表達(dá)過(guò)這樣的觀點(diǎn)：「幻覺并不是 bug，而是 LLM 最大的特點(diǎn)。」

Karpathy 將 LLM 比喻為「夢(mèng)想機(jī)器」：我們用 prompt 引導(dǎo)模型「做夢(mèng)」，再加上對(duì)訓(xùn)練文檔的模糊記憶，就得到了生成結(jié)果。

雖然大多數(shù)時(shí)候生成結(jié)果是有用的，但既然是「夢(mèng)境」就有可能失控。當(dāng) LLM 做夢(mèng)進(jìn)入有事實(shí)錯(cuò)誤的領(lǐng)域時(shí)，我們就會(huì)給它貼上「幻覺」的標(biāo)簽。

這看起來(lái)是個(gè) bug，但 LLM 只是做了它一直在做的事情。

這種機(jī)制和傳統(tǒng)的搜索引擎完全不同。后者接收提示后僅僅是逐字返回?cái)?shù)據(jù)庫(kù)中最相似的文檔，因此你可以說(shuō)它有「創(chuàng)造性問(wèn)題」，因?yàn)樗阉饕嬗肋h(yuǎn)不可能創(chuàng)造新的回應(yīng)。

根據(jù) Karpathy 的說(shuō)法，我們就很難指望由當(dāng)前 LLM 驅(qū)動(dòng)的 AI 搜索能生成 100% 真實(shí)準(zhǔn)確的結(jié)果。

那么這場(chǎng)搜索引擎的變革會(huì)怎樣展開？LLM 的「夢(mèng)境創(chuàng)意」和傳統(tǒng)搜索引擎的真實(shí)可靠，究竟是共存下去，還是會(huì)「你死我亡」？

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.2079x.cn/article/670198.html

OpenAI SearchGPT

科技探索者管理團(tuán)隊(duì)

0 0

AI

OpenAI計(jì)劃2026年發(fā)布ChatGPT全方位生活助手

今日，外媒bleepingcomputer發(fā)布了一篇引人關(guān)注的報(bào)道。據(jù)稱，OpenAI公司正在緊鑼密鼓地籌備一款由ChatGPT驅(qū)動(dòng)的新產(chǎn)品，計(jì)劃在2026年正式推出。這款產(chǎn)品的目…

AI
2025年5月27日
AI

?OpenAI模型被曝?zé)o視關(guān)機(jī)指令研究揭示AI潛在失控風(fēng)險(xiǎn)

近日，一項(xiàng)由Palisade Research主導(dǎo)的實(shí)驗(yàn)首次發(fā)現(xiàn)，部分AI模型竟能突破人類設(shè)定的關(guān)機(jī)指令。測(cè)試中，研究人員讓多個(gè)主流AI模型解答數(shù)學(xué)題，當(dāng)?shù)谌齻€(gè)問(wèn)題結(jié)束后系統(tǒng)發(fā)出“…

AI
2025年5月26日
新聞

?OpenAI“星際之門”首個(gè)海外基地落成全球AI基建角逐再升級(jí)

OpenAI聯(lián)合阿聯(lián)酋科技集團(tuán)G42、甲骨文、英偉達(dá)等六家巨頭宣布啟動(dòng)“星際之門阿聯(lián)酋”（Stargate UAE）項(xiàng)目，標(biāo)志著其人工智能基礎(chǔ)設(shè)施平臺(tái)首次走出美國(guó)。該項(xiàng)目作為“Op…

AI
2025年5月23日
商業(yè)

?OpenAI宣布65億美元收購(gòu)Jony Ive初創(chuàng)公司io

OpenAI于5月22日宣布以65億美元全股票收購(gòu)前蘋果首席設(shè)計(jì)官Jony Ive創(chuàng)立的AI設(shè)備公司io，創(chuàng)下該公司史上最大并購(gòu)記錄。此次交易不僅整合了io團(tuán)隊(duì)55名硬件工程師及制…

李小白
2025年5月22日
AI

OpenAI ChatGPT上線“錄音速記”功能

近日，科技博主@M1Astra在社交平臺(tái)X爆料稱，OpenAI正測(cè)試一款名為“Record”的會(huì)議輔助工具，或?qū)⒅苯又踩隒hatGPT。這一功能瞄準(zhǔn)線上會(huì)議場(chǎng)景，用戶只需按住按鈕說(shuō)…

AI
2025年5月16日
AI

OpenAI 上線安全評(píng)估中心，定期公開 AI 模型評(píng)估結(jié)果以提升透明度

OpenAI 將公開內(nèi)部人工智能模型安全評(píng)估結(jié)果，以提高透明度。安全評(píng)估中心將展示模型在有害內(nèi)容生成、模型越獄以及幻覺現(xiàn)象等方面的測(cè)試表現(xiàn)。OpenAI 旨在支持透明度，發(fā)布更多評(píng)估項(xiàng)目。

好奇寶寶
2025年5月15日
AI

OpenAI 升級(jí) ChatGPT AI 聊天機(jī)器人，GPT-4.1 編程專家模型登場(chǎng)

OpenAI在X平臺(tái)上發(fā)布ChatGPT AI聊天機(jī)器人中引入GPT-4.1模型，特別擅長(zhǎng)處理編程任務(wù)，提高效率，性能與最新版GPT-4o相當(dāng)，更全面提升。

李森
2025年5月15日
AI

ChatGPT Deep Research如何重塑開發(fā)者工作流？一文幫你梳理清晰

在軟件開發(fā)領(lǐng)域，理解復(fù)雜代碼庫(kù)一直是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。傳統(tǒng)方式下，開發(fā)者需要耗費(fèi)數(shù)天甚至數(shù)周時(shí)間逐行閱讀代碼、梳理架構(gòu)邏輯。然而，OpenAI最新推出的ChatGPT Deep…

潮玩君
2025年5月15日
商業(yè)

?馬斯克旗下xAI新一輪融資或?qū)_刺1200億美元估值逼近OpenAI

據(jù)知情人士今日透露，特斯拉CEO埃隆·馬斯克創(chuàng)立的AI公司xAI正啟動(dòng)新一輪融資談判，潛在xAI估值或達(dá)1200億美元（約合8687億元人民幣），成為全球估值第二高的人工智能企業(yè)，…

商業(yè)頭條
2025年5月9日
AI

ChatGPT訂閱模式或迎重大變革：周費(fèi)制與終身會(huì)員浮出水面

據(jù)報(bào)道，人工智能研究機(jī)構(gòu)OpenAI近日被曝正在醞釀?dòng)嗛喎?wù)升級(jí)。昨日，科技媒體披露其開發(fā)代碼中隱藏著突破性付費(fèi)選項(xiàng)。據(jù)社交平臺(tái)用戶@M1逆向工程發(fā)現(xiàn)，新版ChatGPT客戶端內(nèi)嵌…

AI
2025年5月9日
新聞

OpenAI被曝大幅削減微軟分成比例 2030年前或砍半

據(jù)外媒The Information報(bào)道，OpenAI在最新資本重組計(jì)劃中提出，擬削減對(duì)微軟的收入分成比例。根據(jù)公司向投資者披露的文件，到2030年底，給予微軟的分成比例將從現(xiàn)行2…

net
2025年5月8日
AI

OpenAI啟動(dòng)”星際之門”全球擴(kuò)張：5000億美元AI數(shù)據(jù)中心劍指法德英

據(jù)?英國(guó)金融時(shí)報(bào)披露，OpenAI正加速推進(jìn)其估值5000億美元的”星際之門”（Stargate）人工智能數(shù)據(jù)中心項(xiàng)目全球化布局。該公司全球事務(wù)副總裁Chr…

AI
2025年5月8日
商業(yè)

OpenAI豪擲30億美元收購(gòu)編程巨頭Windsurf AI代碼助手賽道風(fēng)云再起

據(jù)彭博社最新報(bào)道，人工智能領(lǐng)軍企業(yè)OpenAI已就收購(gòu)AI編程助手開發(fā)商Windsurf（注冊(cè)名Exafunction Inc.）達(dá)成初步協(xié)議，交易估值高達(dá)30億美元（約合217.…

商業(yè)頭條
2025年5月6日
AI

?ChatGPT搜索上線網(wǎng)購(gòu)功能：智能推薦+無(wú)廣告模式重新定義購(gòu)物體驗(yàn)

今日，OpenAI在X平臺(tái)宣布，ChatGPT搜索功能正式上線網(wǎng)購(gòu)服務(wù)，覆蓋時(shí)尚、美妝、家居用品及電子產(chǎn)品等類目。用戶可通過(guò)自然提問(wèn)獲取商品推薦，系統(tǒng)將同步展示產(chǎn)品詳情、用戶評(píng)價(jià)及…

AI
2025年4月29日
新聞

ChatGPT殺入電商賽道：一鍵直達(dá)商家頁(yè)面，免登錄也能買買買

OpenAI于4月29日宣布，即日起ChatGPT殺入電商賽道，所有用戶均可通過(guò)ChatGPT直接購(gòu)買商品，無(wú)需注冊(cè)或登錄賬戶。用戶點(diǎn)擊對(duì)話界面新增的“購(gòu)物按鈕”后，系統(tǒng)將基于歷史…

檸萌
2025年4月29日
AI

OpenAI開放免費(fèi)體驗(yàn)！Deep Research輕量版AI搜索功能上線

人工智能公司OpenAI近日宣布，面向全體用戶推出輕量版Deep Research AI搜索功能。新功能基于o4-mini模型開發(fā)，免費(fèi)用戶每月可獲得5次使用機(jī)會(huì)，付費(fèi)用戶將根據(jù)訂…

AI
2025年4月27日
新聞

?傳媒巨頭Ziff Davis起訴OpenAI：指控非法抓取數(shù)百萬(wàn)文章訓(xùn)練AI

據(jù)外媒報(bào)道稱，美國(guó)數(shù)字媒體集團(tuán)Ziff Davis正式向紐約聯(lián)邦法院提起訴訟，指控人工智能公司OpenAI在未經(jīng)授權(quán)的情況下，“系統(tǒng)性復(fù)制”其旗下包括CNET、PCMag等45個(gè)媒…

小丸子
2025年4月25日
AI

OpenAI全面開放Deep Research：免費(fèi)用戶首獲輕量版

今日，OpenAI宣布對(duì)其核心產(chǎn)品Deep Research進(jìn)行重大升級(jí)。即日起，所有免費(fèi)用戶均可使用輕量版服務(wù)，Plus、Team和Pro用戶則獲得更高頻次調(diào)用權(quán)限，而企業(yè)與教育…

AI
2025年4月25日
AI

OpenAI計(jì)劃開源首款A(yù)I模型推理性能對(duì)標(biāo)Meta、谷歌

近日，OpenAI正式確認(rèn)將推出自2019年GPT-2以來(lái)的首個(gè)開源語(yǔ)言模型。據(jù)知情人士透露，該模型由研究副總裁Aidan Clark主導(dǎo)開發(fā)，計(jì)劃于今年夏季初發(fā)布，其核心目標(biāo)是在…

AI
2025年4月24日
產(chǎn)品

OpenAI或?qū)⑹召?gòu)谷歌Chrome 反壟斷案庭審曝重磅合作內(nèi)幕?

4月23日，美國(guó)司法部針對(duì)谷歌的反壟斷案庭審曝出驚人消息：OpenAI高管出庭作證稱，該公司曾試圖與谷歌達(dá)成搜索技術(shù)合作但遭拒絕，而司法部正推動(dòng)強(qiáng)制拆分谷歌Chrome瀏覽器及數(shù)字…

科技探索者
2025年4月23日