OpenAI 上線安全評(píng)估中心，定期公開 AI 模型評(píng)估結(jié)果以提升透明度

好奇寶寶 ? 2025年5月15日 16:24:00 ? AI

OpenAI 將公開內(nèi)部人工智能模型安全評(píng)估結(jié)果，以提高透明度。安全評(píng)估中心將展示模型在有害內(nèi)容生成、模型越獄以及幻覺現(xiàn)象等方面的測(cè)試表現(xiàn)。OpenAI 旨在支持透明度，發(fā)布更多評(píng)估項(xiàng)目。

5 月 15 日消息，OpenAI 宣布將更頻繁地公開其內(nèi)部人工智能模型的安全評(píng)估結(jié)果，以提高透明度。該公司于周三正式上線了“安全評(píng)估中心”網(wǎng)頁，旨在展示其模型在有害內(nèi)容生成、模型越獄以及幻覺現(xiàn)象等方面的測(cè)試表現(xiàn)。

OpenAI 上線安全評(píng)估中心，定期公開 AI 模型評(píng)估結(jié)果以提升透明度

OpenAI 表示，該安全評(píng)估中心將用于持續(xù)發(fā)布模型相關(guān)指標(biāo)，并計(jì)劃在未來的重大模型更新后及時(shí)更新網(wǎng)頁內(nèi)容。OpenAI 在一篇博客文章中寫道：“隨著人工智能評(píng)估科學(xué)的不斷發(fā)展，我們致力于分享我們?cè)陂_發(fā)更具可擴(kuò)展性的模型能力與安全評(píng)估方法方面的進(jìn)展?！痹摴具€強(qiáng)調(diào)，通過在此公開部分安全評(píng)估結(jié)果，不僅希望讓用戶更清晰地了解 OpenAI 系統(tǒng)隨時(shí)間的安全性能變化，也期望能夠支持整個(gè)行業(yè)在透明度方面的共同努力。此外，OpenAI 提到可能會(huì)隨著時(shí)間推移在該中心增加更多評(píng)估項(xiàng)目。

此前，OpenAI 曾因部分旗艦?zāi)Ｐ偷陌踩珳y(cè)試流程過快以及未發(fā)布其他模型的技術(shù)報(bào)告而受到一些倫理學(xué)家的批評(píng)。公司首席執(zhí)行官山姆?奧爾特曼（Sam Altman）也因被指在 2023 年 11 月短暫被免職前誤導(dǎo)公司高管關(guān)于模型安全審查的問題而備受爭(zhēng)議。

就在上個(gè)月末，OpenAI 不得不撤銷對(duì) ChatGPT 默認(rèn)模型 GPT-4o 的一次更新。原因是用戶報(bào)告稱該模型的回應(yīng)方式過于“諂媚”，甚至對(duì)一些有問題的、危險(xiǎn)的決策和想法也表示贊同。針對(duì)這一事件，OpenAI 表示將采取一系列修復(fù)和改進(jìn)措施，以防止類似事件再次發(fā)生。其中包括為部分模型引入一個(gè)可選的“alpha 階段”，允許部分 ChatGPT 用戶在模型正式發(fā)布前進(jìn)行測(cè)試并提供反饋。

原創(chuàng)文章，作者：好奇寶寶，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.2079x.cn/article/719231.html

OpenAI 人工智能安全評(píng)估中心

好奇寶寶認(rèn)證作者

0 0

AI

放棄自研模型？蘋果考慮GPT或Claude來支持新Siri

蘋果與 Anthropic 和 OpenAI 探討 Siri 中的模型整合，計(jì)劃推進(jìn)該計(jì)劃。知情人士透露，蘋果要求定制版本的模型以在自有云基礎(chǔ)設(shè)施上運(yùn)行和測(cè)試。此計(jì)劃將推動(dòng)AI功能的發(fā)展，并可能促使蘋果發(fā)展自研技術(shù)。

潮玩君
15小時(shí)前
新聞

古爾曼：蘋果或放棄自研AI模型轉(zhuǎn)向外部合作

據(jù)彭博社記者馬克·古爾曼最新爆料，蘋果正考慮放棄自研AI大語言模型計(jì)劃，轉(zhuǎn)而與Anthropic及OpenAI展開深度合作談判。知情人士透露，該公司正評(píng)估將第三方技術(shù)整合至Siri…

Apple
18小時(shí)前
新聞

Meta對(duì)AI業(yè)務(wù)大洗牌扎克伯格宣布“超級(jí)智能”計(jì)劃

Meta計(jì)劃重新劃分人工智能部門，成立Meta Superintelligence Labs，由Scale AI前CEOAlexandr Wang負(fù)責(zé)。Github前CEONat Friedman將加入該團(tuán)隊(duì)，并負(fù)責(zé)AI產(chǎn)品和應(yīng)用研究。

蘋果派
18小時(shí)前
新聞

OpenAI首席研究官怒斥Meta挖角：如同入室盜竊

今日，OpenAI首席研究官M(fèi)ark Chen在公司內(nèi)部Slack平臺(tái)發(fā)布措辭激烈的備忘錄，將Meta持續(xù)挖角行為比作“闖入家中偷竊”，并呼吁員工對(duì)獵頭采取強(qiáng)硬態(tài)度。他透露正與CE…

NEWS
1天前
新聞

黃仁勛帶頭減持英偉達(dá)高層套現(xiàn)超過10億美元股票

黃仁勛出售英偉達(dá)股票，高管減持引發(fā)市場(chǎng)關(guān)注，英偉達(dá)股價(jià)仍保持強(qiáng)勁漲勢(shì)。

蘋果派
1天前
AI

OpenAI首席研究官：Meta挖人如同“闖入家中偷竊”

OpenAI首席研究官將Meta挖角行為比作“闖入家中偷竊”，提議提供財(cái)務(wù)補(bǔ)償以留住頂尖人才。OpenAI員工近期應(yīng)對(duì)高強(qiáng)度工作周，下周將經(jīng)歷大規(guī)模停工期。

科技探索者
1天前
新聞

消息稱OpenAI進(jìn)軍政府AI定制服務(wù)，收費(fèi)逾千萬美元

近日，有消息稱，OpenAI近期效仿科技公司 Palantir，大力拓展咨詢服務(wù)業(yè)務(wù)，已與美國國防部、印度政府和 Grab 公司簽署定制化人工智能合作協(xié)議，標(biāo)志著其戰(zhàn)略重心向高端客…

AI
1天前
AI

馬斯克確認(rèn)Grok 4將于7月4日后發(fā)布將重寫人類知識(shí)庫

埃隆·馬斯克近日在社交媒體上正式宣布，其人工智能模型Grok 4將于7月4日后發(fā)布，標(biāo)志著xAI團(tuán)隊(duì)在技術(shù)路徑上的重大突破。他透露，該版本將構(gòu)建一個(gè)專門的編程模型，以優(yōu)化底層架構(gòu)，…

AI
3天前
新聞

OpenAI談與《紐約時(shí)報(bào)》版權(quán)訴訟：尊重，但絕不妥協(xié)

據(jù)外媒報(bào)道，在播客節(jié)目《Hard Fork》中，OpenAI CEO奧爾特曼一反常態(tài)主動(dòng)提及與《紐約時(shí)報(bào)》的版權(quán)訴訟。面對(duì)該媒體指控OpenAI未經(jīng)授權(quán)使用其內(nèi)容訓(xùn)練大模型，他特別…

NEWS
5天前
新聞

因商標(biāo)糾紛，OpenAI撤下與蘋果前首席設(shè)計(jì)官喬納森的宣傳視頻

此前，OpenAI發(fā)布了一段宣傳視頻，突出其首席執(zhí)行官薩姆·奧爾特曼與蘋果前首席設(shè)計(jì)官喬納森·伊夫的緊密合作友誼，同時(shí)還宣布了以65億美元收購伊夫共同創(chuàng)立的設(shè)備初創(chuàng)公司io的交易。…

李森
2025年6月23日
新聞

消息稱Meta正在招攬AI大將 148億美元注資同步推進(jìn)

科技巨頭Meta正加速人工智能領(lǐng)域布局，?擬招攬GitHub前首席執(zhí)行官納特·弗里德曼（Nat Friedman）加入其AI團(tuán)隊(duì)?。據(jù)權(quán)威媒體報(bào)道，該公司同時(shí)在與弗里德曼的投資基金…

泡沫大盜
2025年6月21日
新聞

谷歌亞馬遜等科技巨頭強(qiáng)推十年AI監(jiān)管禁令，美國國會(huì)本周激辯

據(jù)報(bào)道，亞馬遜、谷歌、微軟和Meta正通過游說集團(tuán)強(qiáng)力推動(dòng)一項(xiàng)史無前例的聯(lián)邦立法，要求未來十年禁止美國各州監(jiān)管人工智能模型。該提案已納入眾議院”大而美”預(yù)算…

NEWS
2025年6月19日
AI

OpenAI奧爾特曼：GPT-5今夏亮相

OpenAI首席執(zhí)行官奧爾特曼在6月19日公司播客中正式宣布，新一代大模型GPT-5將于今年夏季發(fā)布，這標(biāo)志著生成式AI能力迎來重大升級(jí)，但具體日期仍未敲定。據(jù)《商業(yè)內(nèi)幕》透露，早…

AI
2025年6月19日
商業(yè)

消息稱馬斯克xAI年虧130億美金，急籌93億救急

有消息稱，埃隆·馬斯克旗下的人工智能公司xAI正陷入一場(chǎng)前所未有的財(cái)務(wù)危機(jī)。彭博社最新報(bào)告顯示，該公司為開發(fā)Grok等AI模型，每月燒錢高達(dá)10億美元，主要用于服務(wù)器集群和專用芯片…

商業(yè)頭條
2025年6月19日
AI

馬斯克旗下xAI成本不斷攀升據(jù)悉每月消耗10億美元

馬斯克的人工智能初創(chuàng)公司xAI正在融資93億美元，計(jì)劃在未來三個(gè)月內(nèi)花掉其中一半以上。預(yù)計(jì)在2025年期間將消耗約130億美元，每月超過10億美元。

蘋果派
2025年6月18日
新聞

Meta升級(jí)AI影像廣告工具，TikTok同步加碼生成式廣告競(jìng)賽

當(dāng)?shù)貢r(shí)間周二，Meta宣布全面升級(jí)AI廣告工具，允許廣告商上傳最多20張產(chǎn)品圖片，由人工智能自動(dòng)生成多場(chǎng)景視頻廣告，并可添加背景音樂與定制文案。此舉旨在降低中小企業(yè)的廣告制作成本—…

AI
2025年6月17日
AI

谷歌被曝用 ChatGPT 訓(xùn)練 Gemini，Scale AI 否認(rèn)

谷歌子公司 Scale AI 曾利用 ChatGPT 培訓(xùn) Bard，使其接近 GPT-4。然而，OpenAI 提供禁止使用的服務(wù)條款，Scale AI 承認(rèn)并未使用 ChatGPT 的回復(fù)。

蘋果派
2025年6月17日
新聞

谷歌就長達(dá)數(shù)小時(shí)的云服務(wù)宕機(jī)事件致歉并發(fā)布事故報(bào)告

谷歌因自動(dòng)傳入請(qǐng)求的配額策略檢查功能未測(cè)試，在真實(shí)場(chǎng)景中引發(fā)重大宕機(jī)，全球超70項(xiàng)云服務(wù)停用，導(dǎo)致云服務(wù)癱瘓。公司已道歉，并承諾改進(jìn)系統(tǒng)。谷歌表示將調(diào)整架構(gòu)，確保系統(tǒng)故障時(shí)其他系統(tǒng)仍能運(yùn)行，避免連鎖崩潰。

潮玩君
2025年6月17日
AI

OpenAI新任招聘主管稱公司面臨 “前所未有的增長壓力”

OpenAI正在搶奪頂尖人才，面臨最大動(dòng)態(tài)壓力。OpenAI和競(jìng)爭(zhēng)對(duì)手在招聘工程師和開發(fā)人員，同時(shí)，其他競(jìng)爭(zhēng)對(duì)手也在增加新職位。OpenAI最近收購了iPhone 設(shè)計(jì)師喬尼?艾維的人工智能設(shè)備硬件初創(chuàng)公司。

蘋果派
2025年6月17日
新聞

微軟與OpenAI合作關(guān)系生變，后者指責(zé)存在反競(jìng)爭(zhēng)行為

近日，據(jù)《華爾街日?qǐng)?bào)》披露，隨著OpenAI加速向營利性實(shí)體轉(zhuǎn)型，與微軟雙方緊張關(guān)系持續(xù)升級(jí)。微軟對(duì)此轉(zhuǎn)型持審慎態(tài)度，因?yàn)檫@關(guān)乎其核心利益——包括對(duì)OpenAI知識(shí)產(chǎn)權(quán)的特殊權(quán)利?！?/p>

NEWS
2025年6月17日