OpenAI公布大模型新訓(xùn)練方法：阻止ChatGPT“胡說(shuō)八道”

蘋(píng)果派 ? 2023年6月1日 01:39:45 ? 新聞

OpenAI公司通過(guò)論文介紹了一種全新的方法，來(lái)訓(xùn)練生成式人工智能語(yǔ)言模型

6月1日，據(jù)報(bào)道，當(dāng)?shù)貢r(shí)間周三，OpenAI公司通過(guò)論文介紹了一種全新的方法，來(lái)訓(xùn)練生成式人工智能語(yǔ)言模型。

OpenAI這一研究成果來(lái)得很是時(shí)候，最近，隨著生成式人工智能技術(shù)流行，以及美國(guó)2024年總統(tǒng)大選初步啟動(dòng)，人工智能“胡說(shuō)八道”的問(wèn)題引發(fā)了史無(wú)前例的關(guān)注和討論。

去年，OpenAI公司推出了人工智能對(duì)話撰稿工具ChatGPT，背后依托于GPT3和GPT4語(yǔ)言模型。ChatGPT的優(yōu)秀表現(xiàn)在全世界掀起了生成式人工智能的一股風(fēng)暴，兩個(gè)月之內(nèi)，相關(guān)服務(wù)的月度活躍用戶超過(guò)了一億人，用戶增長(zhǎng)速度創(chuàng)造了新的世界紀(jì)錄。

OpenAI背后的大股東之一是微軟，微軟已經(jīng)累計(jì)對(duì)該公司投資130億美元。目前，OpenAI的市值大約為290億美元。

人工智能“胡說(shuō)八道”，術(shù)語(yǔ)上也被稱為“AI幻覺(jué)”。面對(duì)用戶的提問(wèn)，ChatGPT以及谷歌的Bard等工具會(huì)杜撰出一些虛假信息，看上去像是權(quán)威正確的答案。

比如，今年2月谷歌針對(duì)Bard工具推出了一個(gè)演示視頻，視頻中Bard有關(guān)美國(guó)韋伯太空望遠(yuǎn)鏡的描述就存在錯(cuò)誤。此外，美國(guó)紐約的幾位律師最近使用ChatGPT撰寫(xiě)法律文件，ChatGPT描述了完全虛構(gòu)的案例，這些律師將面臨處罰。

OpenAI公司的研究人員表示，即使是最先進(jìn)的人工智能模型也會(huì)杜撰虛假信息，尤其是在拿不準(zhǔn)的時(shí)候，它們往往傾向于編造事實(shí)。

研究人員表示，在要求多步驟推理的領(lǐng)域，人工智能胡編的后果尤為嚴(yán)重，因?yàn)橐粋€(gè)單一的邏輯錯(cuò)誤會(huì)導(dǎo)致整個(gè)解決方案“翻車”。

OpenAI準(zhǔn)備采用新戰(zhàn)略，防止人工智能胡編。比如在過(guò)去，一旦提供一個(gè)正確的最終答案，模型會(huì)獲得某種鼓勵(lì)，但是以后，在每一個(gè)單一的邏輯推理環(huán)節(jié)如果表現(xiàn)正確，就將獲得鼓勵(lì)反饋。這種模式也被稱之為“過(guò)程監(jiān)督”（以往的模式術(shù)語(yǔ)“結(jié)果監(jiān)督”）。

研究人員表示，“過(guò)程監(jiān)督”模式有助于產(chǎn)生更加清晰合理的回答，它將會(huì)鼓勵(lì)生成式人工智能能夠像人類一樣，在推理思考中做到“環(huán)環(huán)相扣”。

OpenAI公司“隨機(jī)生成數(shù)學(xué)”研究專家卡爾·柯比（Karl Cobbe）表示，發(fā)現(xiàn)并且減少人工智能模型的邏輯錯(cuò)誤，也就是“AI幻覺(jué)”，是構(gòu)建“通用人工智能”的關(guān)鍵一步。另外，“過(guò)程監(jiān)督”模式并非OpenAI公司發(fā)明，但是該公司正在加以推廣普及。

柯比表示，新方法的目的，是解決人工智能胡編問(wèn)題，從而讓語(yǔ)言模型能夠解決更加復(fù)雜的推理難題。

這位專家介紹，OpenAI已經(jīng)發(fā)布了一個(gè)研究使用的數(shù)據(jù)集，包括80萬(wàn)條人工標(biāo)簽，可用上述新模式訓(xùn)練語(yǔ)言模型。

不過(guò)，美國(guó)電子隱私信息中心的資深律師本·魏特斯（Ben Winters）對(duì)這種新的訓(xùn)練模式表示質(zhì)疑，他希望親自查看OpenAI的完整數(shù)據(jù)集，以及相關(guān)的例子。

魏特斯表示，目前生成式人工智能還處于野蠻生長(zhǎng)時(shí)代，OpenAI的新模式還無(wú)法實(shí)質(zhì)性緩解AI胡編亂造錯(cuò)誤答案的問(wèn)題。

這位律師表示，最重要的是，OpenAI是否會(huì)將一些研究論文成果部署到實(shí)際產(chǎn)品中，如果沒(méi)有這樣的計(jì)劃，這將會(huì)引發(fā)社會(huì)質(zhì)疑，即他們到底要向公眾發(fā)布怎樣的最終產(chǎn)品。

美國(guó)布朗大學(xué)的學(xué)者維克塔（Suresh Venkatasubramanian）表示，目前還不清楚OpenAI的研究論文是否經(jīng)過(guò)了同行評(píng)議，他認(rèn)為這一研究還僅僅停留在“初步觀察”階段。

維克塔表示，在做出某種確定性結(jié)論之前，研究論文還需要在學(xué)術(shù)圈子內(nèi)進(jìn)行更多傳播。他認(rèn)為，如今，人工智能領(lǐng)域每天都會(huì)有很多研究成果，但是“大型語(yǔ)言模型”在工作時(shí)存在不穩(wěn)定性，因此在某種條件、背景或者模式下的運(yùn)行結(jié)果，可能無(wú)法應(yīng)用于另外一種條件、背景或模式。

維克塔認(rèn)為，在人工智能胡編的問(wèn)題中，包括了語(yǔ)言模型胡編一些他人引言或者參考信息。OpenAI的新論文并沒(méi)有證據(jù)能解決這一問(wèn)題。

OpenAI專家柯比表示，未來(lái)將會(huì)在學(xué)術(shù)會(huì)議上把論文交給其他人，進(jìn)行同行評(píng)議。對(duì)于何時(shí)將會(huì)把研究成果和“過(guò)程監(jiān)督”整合到ChatGPT等最終產(chǎn)品中，OpenAI尚未發(fā)表官方評(píng)論。

美國(guó)人工智能研究專家薩拉·邁爾斯·韋斯特（Sarah Myers West）表示，人工智能公司開(kāi)始解決虛假答案問(wèn)題，這是一個(gè)好消息，但OpenAI目前的論文還停留在“公司內(nèi)部研究”的階段，還需要攻克更多難關(guān)。

韋斯特表示,在論文中，OpenAI發(fā)布一個(gè)“人類級(jí)反饋”的小規(guī)模數(shù)據(jù)集，但是并沒(méi)有訓(xùn)練GPT4模型所用數(shù)據(jù)的更多介紹。雖然生成式人工智能已經(jīng)開(kāi)始改變普通人的工作生活，但是距離“負(fù)責(zé)任的人工智能應(yīng)用”，還存在相當(dāng)多的技術(shù)挑戰(zhàn)。

原創(chuàng)文章，作者：蘋(píng)果派，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.2079x.cn/article/572147.html

蘋(píng)果派管理團(tuán)隊(duì)

0 0

新聞

?OpenAI“星際之門”首個(gè)海外基地落成全球AI基建角逐再升級(jí)

OpenAI聯(lián)合阿聯(lián)酋科技集團(tuán)G42、甲骨文、英偉達(dá)等六家巨頭宣布啟動(dòng)“星際之門阿聯(lián)酋”（Stargate UAE）項(xiàng)目，標(biāo)志著其人工智能基礎(chǔ)設(shè)施平臺(tái)首次走出美國(guó)。該項(xiàng)目作為“Op…

AI
1天前
商業(yè)

?OpenAI宣布65億美元收購(gòu)Jony Ive初創(chuàng)公司io

OpenAI于5月22日宣布以65億美元全股票收購(gòu)前蘋(píng)果首席設(shè)計(jì)官Jony Ive創(chuàng)立的AI設(shè)備公司io，創(chuàng)下該公司史上最大并購(gòu)記錄。此次交易不僅整合了io團(tuán)隊(duì)55名硬件工程師及制…

李小白
2天前
AI

實(shí)測(cè)OpenAI 的GPT-4.1性能表現(xiàn)如何？GPT-4.1為何重要

5月19日，OpenAI 宣布，將其最新大型語(yǔ)言模型 GPT-4.1 正式集成至 ChatGPT 的付費(fèi)訂閱服務(wù)（包括 Plus、Pro 和 Team 版本）。此前，該模型僅面向開(kāi)…

科技探索者
5天前
AI

OpenAI ChatGPT上線“錄音速記”功能

近日，科技博主@M1Astra在社交平臺(tái)X爆料稱，OpenAI正測(cè)試一款名為“Record”的會(huì)議輔助工具，或?qū)⒅苯又踩隒hatGPT。這一功能瞄準(zhǔn)線上會(huì)議場(chǎng)景，用戶只需按住按鈕說(shuō)…

AI
2025年5月16日
AI

OpenAI 上線安全評(píng)估中心，定期公開(kāi) AI 模型評(píng)估結(jié)果以提升透明度

OpenAI 將公開(kāi)內(nèi)部人工智能模型安全評(píng)估結(jié)果，以提高透明度。安全評(píng)估中心將展示模型在有害內(nèi)容生成、模型越獄以及幻覺(jué)現(xiàn)象等方面的測(cè)試表現(xiàn)。OpenAI 旨在支持透明度，發(fā)布更多評(píng)估項(xiàng)目。

好奇寶寶
2025年5月15日
AI

OpenAI 升級(jí) ChatGPT AI 聊天機(jī)器人，GPT-4.1 編程專家模型登場(chǎng)

OpenAI在X平臺(tái)上發(fā)布ChatGPT AI聊天機(jī)器人中引入GPT-4.1模型，特別擅長(zhǎng)處理編程任務(wù)，提高效率，性能與最新版GPT-4o相當(dāng)，更全面提升。

李森
2025年5月15日
AI

ChatGPT Deep Research如何重塑開(kāi)發(fā)者工作流？一文幫你梳理清晰

在軟件開(kāi)發(fā)領(lǐng)域，理解復(fù)雜代碼庫(kù)一直是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。傳統(tǒng)方式下，開(kāi)發(fā)者需要耗費(fèi)數(shù)天甚至數(shù)周時(shí)間逐行閱讀代碼、梳理架構(gòu)邏輯。然而，OpenAI最新推出的ChatGPT Deep…

潮玩君
2025年5月15日
商業(yè)

?臺(tái)積電4月銷售額同比飆升48%，創(chuàng)近三年新高

全球半導(dǎo)體代工龍頭臺(tái)積電今日公布2025年4月運(yùn)營(yíng)數(shù)據(jù)：當(dāng)月銷售額達(dá)3495.67億新臺(tái)幣（約合837億元人民幣），較去年同期激增48.1%，環(huán)比增長(zhǎng)22.2%。這一單月增幅創(chuàng)下近…

若安丶
2025年5月9日
商業(yè)

?馬斯克旗下xAI新一輪融資或?qū)_刺1200億美元估值逼近OpenAI

據(jù)知情人士今日透露，特斯拉CEO埃隆·馬斯克創(chuàng)立的AI公司xAI正啟動(dòng)新一輪融資談判，潛在xAI估值或達(dá)1200億美元（約合8687億元人民幣），成為全球估值第二高的人工智能企業(yè)，…

商業(yè)頭條
2025年5月9日
AI

ChatGPT訂閱模式或迎重大變革：周費(fèi)制與終身會(huì)員浮出水面

據(jù)報(bào)道，人工智能研究機(jī)構(gòu)OpenAI近日被曝正在醞釀?dòng)嗛喎?wù)升級(jí)。昨日，科技媒體披露其開(kāi)發(fā)代碼中隱藏著突破性付費(fèi)選項(xiàng)。據(jù)社交平臺(tái)用戶@M1逆向工程發(fā)現(xiàn)，新版ChatGPT客戶端內(nèi)嵌…

AI
2025年5月9日
新聞

OpenAI被曝大幅削減微軟分成比例 2030年前或砍半

據(jù)外媒The Information報(bào)道，OpenAI在最新資本重組計(jì)劃中提出，擬削減對(duì)微軟的收入分成比例。根據(jù)公司向投資者披露的文件，到2030年底，給予微軟的分成比例將從現(xiàn)行2…

net
2025年5月8日
AI

蘋(píng)果聯(lián)手Anthropic打造AI編碼神器 Xcode新版整合Claude模型

蘋(píng)果公司正與人工智能新銳Anthropic深度合作，開(kāi)發(fā)名為「氛圍編碼」（vibe-coding）的AI輔助編程平臺(tái)。該平臺(tái)將作為Xcode開(kāi)發(fā)環(huán)境的新版本，集成Anthropic…

AI
2025年5月8日
AI

OpenAI啟動(dòng)”星際之門”全球擴(kuò)張：5000億美元AI數(shù)據(jù)中心劍指法德英

據(jù)?英國(guó)金融時(shí)報(bào)披露，OpenAI正加速推進(jìn)其估值5000億美元的”星際之門”（Stargate）人工智能數(shù)據(jù)中心項(xiàng)目全球化布局。該公司全球事務(wù)副總裁Chr…

AI
2025年5月8日
商業(yè)

OpenAI豪擲30億美元收購(gòu)編程巨頭Windsurf AI代碼助手賽道風(fēng)云再起

據(jù)彭博社最新報(bào)道，人工智能領(lǐng)軍企業(yè)OpenAI已就收購(gòu)AI編程助手開(kāi)發(fā)商Windsurf（注冊(cè)名Exafunction Inc.）達(dá)成初步協(xié)議，交易估值高達(dá)30億美元（約合217.…

商業(yè)頭條
2025年5月6日
新聞

美國(guó)兩黨聯(lián)手立法：擬強(qiáng)制英偉達(dá)AI芯片植入“定位追蹤”防走私

美國(guó)民主黨眾議員比爾·福斯特（Bill Foster）計(jì)劃未來(lái)數(shù)周提交法案，要求對(duì)英偉達(dá)等公司的人工智能芯片實(shí)施“定位追蹤”及運(yùn)行限制，以遏制走私至中國(guó)等被管制國(guó)家的行為。這一提案…

小科同學(xué)
2025年5月6日
AI

?谷歌Gemini AI將推Ultra訂閱版！視頻生成限制或解除

近日，據(jù)外媒報(bào)道稱，谷歌計(jì)劃擴(kuò)展其人工智能服務(wù)Gemini AI的訂閱體系，或新增“Gemini Ultra”高級(jí)層級(jí)。此舉或進(jìn)一步強(qiáng)化其在生成式AI領(lǐng)域的商業(yè)化布局。目前，谷歌…

Google
2025年5月2日
新聞

馬斯克官宣Grok 3.5下周上線首個(gè)能解答火箭難題的AI要來(lái)了

當(dāng)?shù)貢r(shí)間4月29日，特斯拉及SpaceX創(chuàng)始人埃隆·馬斯克通過(guò)社交平臺(tái)宣布，旗下人工智能產(chǎn)品Grok 3.5的早期測(cè)試版將于下周正式向“SuperGrok”訂閱用戶開(kāi)放。他稱，Gr…

AI
2025年4月30日
AI

?ChatGPT搜索上線網(wǎng)購(gòu)功能：智能推薦+無(wú)廣告模式重新定義購(gòu)物體驗(yàn)

今日，OpenAI在X平臺(tái)宣布，ChatGPT搜索功能正式上線網(wǎng)購(gòu)服務(wù)，覆蓋時(shí)尚、美妝、家居用品及電子產(chǎn)品等類目。用戶可通過(guò)自然提問(wèn)獲取商品推薦，系統(tǒng)將同步展示產(chǎn)品詳情、用戶評(píng)價(jià)及…

AI
2025年4月29日
新聞

ChatGPT殺入電商賽道：一鍵直達(dá)商家頁(yè)面，免登錄也能買買買

OpenAI于4月29日宣布，即日起ChatGPT殺入電商賽道，所有用戶均可通過(guò)ChatGPT直接購(gòu)買商品，無(wú)需注冊(cè)或登錄賬戶。用戶點(diǎn)擊對(duì)話界面新增的“購(gòu)物按鈕”后，系統(tǒng)將基于歷史…

檸萌
2025年4月29日
AI

OpenAI開(kāi)放免費(fèi)體驗(yàn)！Deep Research輕量版AI搜索功能上線

人工智能公司OpenAI近日宣布，面向全體用戶推出輕量版Deep Research AI搜索功能。新功能基于o4-mini模型開(kāi)發(fā)，免費(fèi)用戶每月可獲得5次使用機(jī)會(huì)，付費(fèi)用戶將根據(jù)訂…

AI
2025年4月27日

OpenAI公布大模型新訓(xùn)練方法：阻止ChatGPT“胡說(shuō)八道”

相關(guān)推薦