2023年,注定是AIGC發(fā)展的關(guān)鍵一年,它標(biāo)志著人工智能逐漸從學(xué)術(shù)研究走向產(chǎn)業(yè)化,并與商業(yè)融合形成互為支點的發(fā)展格局,進(jìn)入產(chǎn)業(yè)商用期。
技術(shù)無罪,商用卻有風(fēng)險。不少AIGC平臺在上線后僅僅幾天時間內(nèi)就頻頻遭遇翻車。究其背后,是國家對人工智能技術(shù)發(fā)展的引導(dǎo)和規(guī)范體現(xiàn)。
4月11日,國家互聯(lián)網(wǎng)信息辦公室公布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》(以下簡稱辦法)。這代表著,國內(nèi)即將迎來首個AIGC新規(guī)。其中,在《辦法》的21條政策中釋放出了一條的關(guān)鍵信號,國家支持AIGC的健康發(fā)展和商業(yè)應(yīng)用,前提必須是合法合規(guī),且有13條規(guī)定都明確指向了”AIGC 提供商“。
在此背景下,網(wǎng)易易盾從AIGC提供商運營角度出發(fā),結(jié)合國家政策與豐富的行業(yè)經(jīng)驗,提供覆蓋事前—平臺運營前置的風(fēng)險、事中—平臺內(nèi)容合規(guī)風(fēng)險、事后—投訴與違規(guī)處理風(fēng)險的全流程解決方案。
01 事前—平臺運營前置風(fēng)險
1. AI算法治理
從算法治理角度出發(fā),AIGC提供商有責(zé)任在平臺投入使用前對可能產(chǎn)生的問題進(jìn)行預(yù)估、判定并制定相對應(yīng)的措施,對算法使用過程中的安全監(jiān)測、算法評估以及算法推薦對個人信息主體帶來的影響等內(nèi)容進(jìn)行規(guī)范。
同時,《辦法》中明確規(guī)定,AIGC服務(wù)及生成內(nèi)容必須“符合社會主義的價值觀”,防止出現(xiàn)民族、信仰等歧視、尊重商業(yè)道德、尊重他人合法權(quán)益、“防止生成虛假信息”等意識形態(tài)與價值傾向問題。
因此,人工智能服務(wù)提供者應(yīng)當(dāng)對生成式人工智能產(chǎn)品的預(yù)訓(xùn)練數(shù)據(jù)、優(yōu)化訓(xùn)練數(shù)據(jù)來源的合法性負(fù)責(zé),提供預(yù)訓(xùn)練和優(yōu)化訓(xùn)練數(shù)據(jù)的來源等描述,人工標(biāo)注規(guī)則,人工標(biāo)注數(shù)據(jù)的規(guī)模和類型等必要信息。
由于大模型依賴訓(xùn)練數(shù)據(jù),在數(shù)據(jù)輸入層面可能會存在惡意操縱的風(fēng)險,包括有毒輸入、偏見、意識形態(tài)攻擊、輿論操控、虛假信息、隱私泄露等。因此,模型訓(xùn)練語料庫基本決定AIGC生成內(nèi)容的價值觀。數(shù)據(jù)標(biāo)注是AI數(shù)據(jù)訓(xùn)練流程中的“關(guān)鍵一步”,純凈、貼合AI應(yīng)用場景的數(shù)據(jù)源可解決數(shù)據(jù)訓(xùn)練中90%的問題。
對此,易盾可對模型訓(xùn)練語料庫提供人工標(biāo)注服務(wù)。易盾擁有頭部企業(yè)海量數(shù)據(jù)的標(biāo)注經(jīng)驗,可快速、準(zhǔn)確地提供專業(yè)人工標(biāo)注服務(wù),涵蓋文字、圖片、音視頻及特殊場景和人物,同時對激增數(shù)據(jù)量可建立應(yīng)急響應(yīng)流程,為模型訓(xùn)練提供貼合使用場景的高質(zhì)量數(shù)據(jù)。
2. 安全管理制度
用戶認(rèn)證管理
AIGC提供商需提供涵蓋用戶認(rèn)證、重點群體保護(hù)和算法透明服務(wù)。按照《中華人民共和國網(wǎng)絡(luò)安全法》規(guī)定,提供生成式人工智能服務(wù)應(yīng)當(dāng)要求用戶提供真實身份信息。
在強(qiáng)化信息認(rèn)證能力方面,易盾提供多種身份驗證方式,靈活組合;創(chuàng)新算法能力,有效應(yīng)對AI技術(shù)合成人臉、3D面具等假體攻擊;同時在登錄注冊或使用AIGC服務(wù)前集成調(diào)用信息認(rèn)證能力,減少惡意注冊的安全風(fēng)險。
技術(shù)安全評估
《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》第二十條 深度合成服務(wù)提供者開發(fā)上線具有輿論屬性或者社會動員能力的新產(chǎn)品、新應(yīng)用、新功能的,應(yīng)當(dāng)按照國家有關(guān)規(guī)定開展安全評估。
易盾可協(xié)助AIGC提供商建立健全AIGC相關(guān)的安全管理制度及業(yè)務(wù)技術(shù)資料的支持,協(xié)助企業(yè)進(jìn)行現(xiàn)場迎檢,包括文件準(zhǔn)備,人員訪談,技術(shù)檢測,問題記錄,問題整改。
服務(wù)算法備案
AIGC提供商應(yīng)按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》履行算法備案和變更、注銷備案手續(xù)。易盾可提供算法備案咨詢?nèi)鞒谭?wù),協(xié)助企業(yè)完成備案信息填報。
02 事中—平臺內(nèi)容合規(guī)風(fēng)險
1.AI實時交互內(nèi)容審核
為了遵守法律法規(guī)和體現(xiàn)社會主義核心價值觀,對于實時交互內(nèi)容審核和利用AI生成內(nèi)容,需要加強(qiáng)敏感內(nèi)容審核,例如涉政、涉黃、涉暴等內(nèi)容,以確保信息的安全和合規(guī)性。然而,特殊的prompt指令可能會繞過AI自身的安全機(jī)制,增加審核的難度和復(fù)雜度。
為了解決這個問題,網(wǎng)易易盾提供了針對AIGC+UGC場景下的機(jī)器審核能力,可根據(jù)業(yè)務(wù)場景配置審核的松緊程度,選擇適當(dāng)?shù)膶徍瞬呗詠頋M足不同場景的合規(guī)要求。
如在語聊對話場景中,存在真實用戶和智能機(jī)器人兩種角色,這要求機(jī)審能夠快速識別不良信息,確保人機(jī)聊天的實時性。易盾的機(jī)審技術(shù)可根據(jù)業(yè)務(wù)場景不同,在UGC內(nèi)容和AIGC生成內(nèi)容配置不同的松緊度審核策略,兼顧用戶使用體驗和內(nèi)容安全合規(guī)性。
2.上下文關(guān)聯(lián)分析+人審
AI生成內(nèi)容由于算法機(jī)制原因,存在用戶利用敏感話題、循序誘導(dǎo)提問等方式輸出不當(dāng)AIGC內(nèi)容的情況,特別是包含多條上下文內(nèi)容,單詞條閱讀沒有問題,關(guān)聯(lián)上下文多詞條閱讀會有違法違規(guī)的信息,違法人員常借用藏頭詩、情景劇本、歌詞等形式生成長文本(長圖)分享,來躲避平臺的審查機(jī)制。
網(wǎng)易易盾自主研發(fā)AI語義分析技術(shù),提供AI機(jī)審上下文關(guān)聯(lián)能力;并結(jié)合人工審核,對AI生成的長圖分享、記憶薄等內(nèi)容進(jìn)行關(guān)聯(lián)檢測分析。另外易盾自主研發(fā)的人工審核系統(tǒng)能還原真實對話場景,區(qū)分AI機(jī)器人與真實用戶的會話,大幅提高審核精準(zhǔn)度及審核效率,有效識別和防范用戶利用敏感話題、循序誘導(dǎo)提問等方式輸出不當(dāng)信息。
3.AI偽造內(nèi)容識別
由于Deepfake等技術(shù)的濫用可能會導(dǎo)致嚴(yán)重的詐騙和欺詐行為,因此需要采取措施來打擊AI濫用行為。易盾基于深度偽造識別算法,打造了動態(tài)防御機(jī)制,可以識別由AI生成的視頻或音頻。這種技術(shù)可以識別Deepfake等虛假信息,從而保護(hù)社交網(wǎng)絡(luò)和其他在線平臺的用戶免受欺詐和詐騙的侵害。
根據(jù)《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》對于由AI生成的圖片、視頻等內(nèi)容需要進(jìn)行標(biāo)識,以確保信息的真實性和準(zhǔn)確性,避免虛假信息的傳播造成不良影響。網(wǎng)易易盾建議平臺提供深度合成內(nèi)容的顯著標(biāo)識功能,用戶在創(chuàng)作AIGC內(nèi)容的時候可以自行完成顯著標(biāo)識的標(biāo)記操作。標(biāo)識AI生成的內(nèi)容,以及采取防御措施來打擊AI濫用行為,是確?;ヂ?lián)網(wǎng)信息安全的重要措施。
03 事后—投訴與違規(guī)處理風(fēng)險
網(wǎng)易易盾可協(xié)助用戶建立投訴接管機(jī)制,建議平臺提供用戶投訴舉報渠道,鼓勵用戶參與平臺內(nèi)容治理,易盾智能審核系統(tǒng)也將提供用戶投訴舉報審核機(jī)制,打通機(jī)器審核和平臺業(yè)務(wù)接口,及時對用戶投訴舉報內(nèi)容進(jìn)行審核處置。
AIGC大大降低了創(chuàng)作門檻,為信息生產(chǎn)和傳播帶來了新的變革和機(jī)遇。對于AIGC提供商而言,與機(jī)遇并存更多的風(fēng)險與挑戰(zhàn)。
新技術(shù)與新行業(yè)的發(fā)展往往與政策合規(guī)相輔相成,如何在合規(guī)的基礎(chǔ)上穩(wěn)步實現(xiàn)應(yīng)用落地、推進(jìn)產(chǎn)品迭代,是AIGC提供商入局后繞不開的一點。作為新一代數(shù)字內(nèi)容風(fēng)控服務(wù)商,網(wǎng)易易盾將幫助AIGC平臺合規(guī)發(fā)展,為新行業(yè)的可持續(xù)發(fā)展持續(xù)做貢獻(xiàn)。
(本內(nèi)容屬于網(wǎng)絡(luò)轉(zhuǎn)載,文中涉及圖片等內(nèi)容如有侵權(quán),請聯(lián)系編輯刪除。市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣及投資依據(jù)。)
原創(chuàng)文章,作者:陳晨,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/571573.html