OpenAI SearchGPT 官方演示大翻車,源代碼竟暴露搜索機制

SearchGPT 發(fā)布剛過兩天,已有人灰度測試到了。今天,網(wǎng)友 Kesku 自制的 demo 全網(wǎng)刷屏,SearchGPT 結(jié)果輸出如此神速,讓所有人為之震驚。

SearchGPT 發(fā)布剛過兩天,已有人灰度測試到了。今天,網(wǎng)友 Kesku 自制的 demo 全網(wǎng)刷屏,SearchGPT 結(jié)果輸出如此神速,讓所有人為之震驚。

OpenAI SearchGPT 官方演示大翻車,源代碼竟暴露搜索機制

但另一方面,OpenAI 當(dāng)天放出的官方演示,被外媒《大西洋月刊》曝出其中的問題。在回答「8 月在北卡羅來納 Boone 舉辦的音樂節(jié)」的問題時,SearchGPT 竟弄錯時間,出現(xiàn)了幻覺。

OpenAI 發(fā)言人 Kayla Wood 已經(jīng)向《大西洋月刊》承認了這個錯誤,并表示「這僅是初始的原型,我們將不斷改進?!?/p>

這個錯誤讓人不禁想起 Bard 曾經(jīng)造成的慘劇。

2023 年 2 月,谷歌推出了這個聊天機器人產(chǎn)品以對抗 ChatGPT,但首次亮相就出現(xiàn)了事實性錯誤,導(dǎo)致 Alphabet 股價當(dāng)天暴跌 9%,市值瞬間蒸發(fā) 1000 億美元。

Bard 稱 James Webb 太空望遠鏡拍攝了系外行星的第一張照片,但實際上這個功績屬于歐洲南部天文臺的 VLT

但好在,OpenAI 沒有股價可跌,而且僅開放內(nèi)測的做法也是相當(dāng)謹慎。畢竟有谷歌的前車之鑒,可以預(yù)料到,LLM 這種錯誤幾乎是無法避免的。

即使 OpenAI 能夠找到方法大幅減少 SearchGPT 的幻覺,但面對龐大的訪問量也是「杯水車薪」。

假設(shè)幻覺率僅為 1%(這個比率很難達到),按照谷歌的規(guī)模,也會導(dǎo)致每天產(chǎn)生數(shù)千萬個錯誤答案。

更何況,我們目前還沒有發(fā)現(xiàn)足夠可靠且有效的方法,來消除 LLM 的廢話和幻覺。

而且,Andrej Karpathy 大佬曾經(jīng)在推特上表達過這樣的觀點:「幻覺并不是 bug,而是 LLM 最大的特點?!?/p>

Karpathy 將 LLM 比喻為「夢想機器」:我們用 prompt 引導(dǎo)模型「做夢」,再加上對訓(xùn)練文檔的模糊記憶,就得到了生成結(jié)果。

雖然大多數(shù)時候生成結(jié)果是有用的,但既然是「夢境」就有可能失控。當(dāng) LLM 做夢進入有事實錯誤的領(lǐng)域時,我們就會給它貼上「幻覺」的標簽。

這看起來是個 bug,但 LLM 只是做了它一直在做的事情。

這種機制和傳統(tǒng)的搜索引擎完全不同。后者接收提示后僅僅是逐字返回數(shù)據(jù)庫中最相似的文檔,因此你可以說它有「創(chuàng)造性問題」,因為搜索引擎永遠不可能創(chuàng)造新的回應(yīng)。

根據(jù) Karpathy 的說法,我們就很難指望由當(dāng)前 LLM 驅(qū)動的 AI 搜索能生成 100% 真實準確的結(jié)果。

那么這場搜索引擎的變革會怎樣展開?LLM 的「夢境創(chuàng)意」和傳統(tǒng)搜索引擎的真實可靠,究竟是共存下去,還是會「你死我亡」?

原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/670198.html

科技探索者的頭像科技探索者管理團隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論