YouTube首席執(zhí)行官尼爾·莫漢(Neal Mohan)近日在接受媒體采訪時,就OpenAI旗下文本生成視頻AI模型Sora的訓練數(shù)據(jù)問題發(fā)表看法。莫漢雖然沒有直接證據(jù)表明OpenAI使用了YouTube視頻進行模型訓練,但他明確指出,這種行為若屬實,將違反YouTube的現(xiàn)行平臺服務條款。
莫漢強調(diào),創(chuàng)作者在YouTube平臺上上傳視頻時,享有特定的權益和期望,其中包括對視頻內(nèi)容的合理使用和保護。根據(jù)YouTube的服務條款,未經(jīng)授權下載視頻或視頻片段用于其他目的,尤其是用于訓練AI模型,是明確禁止的。莫漢進一步表示,這種違規(guī)行為違背了創(chuàng)作者與YouTube之間建立的服務協(xié)議和信任關系。
值得注意的是,雖然莫漢對OpenAI的行為表示擔憂,但他也承認了YouTube的母公司谷歌在培訓自家AI模型Gemini時使用了YouTube上的內(nèi)容。他強調(diào),谷歌在使用這些內(nèi)容之前,已經(jīng)獲得了創(chuàng)作者的授權,并嚴格遵守了與創(chuàng)作者之間的合同協(xié)議。這一表態(tài)似乎也在暗示OpenAI在利用YouTube視頻進行模型訓練時,并未遵循類似的授權和合規(guī)流程。
OpenAI方面對于Sora模型的訓練數(shù)據(jù)來源一直保持較為模糊的態(tài)度。公司首席技術官Mira Murati在接受采訪時,對于是否使用了YouTube視頻作為訓練數(shù)據(jù)的問題并未給出明確答復,只是表示如果視頻是公開可用且合法的,那么可能會被納入訓練集,但她本人對此并不確定。
此次事件引發(fā)了關于AI模型訓練數(shù)據(jù)使用合規(guī)性的廣泛討論。隨著人工智能技術的快速發(fā)展,AI模型的訓練數(shù)據(jù)來源和使用方式成為業(yè)界關注的焦點。如何確保訓練數(shù)據(jù)的合法性、尊重創(chuàng)作者權益,以及遵循相關法規(guī)和行業(yè)規(guī)范,將是未來AI技術發(fā)展面臨的重要挑戰(zhàn)。
YouTube作為全球最大的視頻分享平臺之一,其對于內(nèi)容版權和數(shù)據(jù)使用的態(tài)度具有廣泛的影響力。莫漢的表態(tài)無疑向業(yè)界傳遞了一個明確的信息:任何未經(jīng)授權使用YouTube視頻進行AI模型訓練的行為,都將受到平臺的嚴厲打擊。
對于OpenAI而言,如何在追求技術創(chuàng)新的同時,確保合規(guī)使用訓練數(shù)據(jù),將是其未來發(fā)展中需要認真考慮的問題。同時,這也提醒了其他AI企業(yè)和研究機構(gòu),在利用公開數(shù)據(jù)進行模型訓練時,必須尊重原始數(shù)據(jù)的版權和隱私,遵循相關法規(guī)和行業(yè)規(guī)范,以實現(xiàn)可持續(xù)和負責任的AI發(fā)展。
原創(chuàng)文章,作者:聆聽,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/643793.html