NEAR 聯(lián)創(chuàng) Illia：為何 AI 需要 Web3？

cl15 ? 2024年4月11日 18:50:00 ? 商業(yè)

近日，NEAR聯(lián)創(chuàng)Illia出席了“2024香港Web3嘉年華”活動，并發(fā)表AI和Web3相關(guān)話題的重要演講。本文特對其演講進行了整理，略有刪減。

大家好，我是NEAR的聯(lián)合創(chuàng)始人Illia，今天我們將討論為什么AI需要Web3。NEAR實際上起源于AI，在開始創(chuàng)業(yè)之旅之前，我在Google Research工作，專注于自然語言理解，也是谷歌深度學(xué)習框架TensorFlow的主要貢獻者之一。在一群同事的共同努力下，我們創(chuàng)造了首個“Transformers”模型，它帶來了我們現(xiàn)在看到的重大創(chuàng)新，推動了AI的發(fā)展，這也是GPT中的“T”的由來。

后來我離開谷歌創(chuàng)辦了NEAR。作為一家AI初創(chuàng)公司，我們會教機器編程，我們的方法之一是做大量的數(shù)據(jù)標記，讓學(xué)生為我們創(chuàng)建數(shù)據(jù)，我們面臨著支付他們工資的問題，因為他們來自全球各地，他們中的一些人甚至沒有銀行賬戶。我們開始研究區(qū)塊鏈作為應(yīng)對方法，并意識到?jīng)]有什么能滿足我們的需求，即可擴容、低費用、易使用和易上手。也是在此時我們創(chuàng)建了NEAR協(xié)議。

對不熟悉的人說，語言模型并非新事物，它們從20世紀50年代就存在了。通用的統(tǒng)計模型允許對語言建模，并在各種應(yīng)用中使用它。對我來說，真正有趣的創(chuàng)新發(fā)生在2013年，當時引入了詞嵌入，這個創(chuàng)意可以讓我們從“紐約”這樣的符號，新增到多維度的向量中并轉(zhuǎn)換為數(shù)學(xué)形式。這與深度學(xué)習模型配合得很好，它們只是大量的矩陣乘法和激活函數(shù)。

2013年后我加入谷歌。在2014年初，研究中使用的主要模型是RNN。它與人類一次閱讀一個單詞的方法相似，這有一個巨大的限制，如果你想閱讀多個文檔來回答一個問題，你將有一個相當大的延遲，這在Google上的生產(chǎn)中使用是不可行的。

Transformer誕生于我們在解決RNN挑戰(zhàn)的過程中。我們嘗試利用計算中的并行性，它更多存在于硬件中，特別是在GPU中，幾乎可以消耗整個文檔，并嘗試同時理解它，而不需要一次執(zhí)行1個步驟，沒有這種瓶頸。這允許我們?yōu)镺penAI團隊引入一個模型后，真正擴展它，在非常大的語料庫上預(yù)訓(xùn)練它，這催生了我們今天看到的ChatGPT、Gemini和其他模型等重大創(chuàng)新。

現(xiàn)在我們看到AI出現(xiàn)了重大創(chuàng)新，而且這種創(chuàng)新還在加速。這些模型能夠進行基本的推理，他們有常識。我們看到人們繼續(xù)挑戰(zhàn)這些模型的極限。我認為，重要的是，在機器學(xué)習和數(shù)據(jù)科學(xué)領(lǐng)域有人在解釋結(jié)果。現(xiàn)在有趣的是大語言模型能夠直接與人交流，并且能夠與其他應(yīng)用和工具進行交互。所以現(xiàn)在我們有了技術(shù)手段可以繞過中間人來解釋結(jié)果。

對于那些不熟悉的人來說，當我們談?wù)撨@些模型被GPU訓(xùn)練或被使用時，它們其實并不是游戲機GPU或加密挖礦GPU。這是一臺專業(yè)的超級計算機，一臺機器上通常有八個GPU，它們具有巨大的競爭能力。這些機器被堆放在架子上，這些機架大多部署在數(shù)據(jù)中心。你訓(xùn)練相當大的模型如Groq，花費3個月的時間，動用10,000個H100。租借設(shè)備將花費你6,400萬美元。更重要的是，除了計算本身之外還有連接性。

這里的一個重要部分是A100，特別是H100，通過每秒900千兆字節(jié)的連接速度連接。所以作為參考，你的CPU到RAM，以每秒9千兆字節(jié)的速度連接。在數(shù)據(jù)中心機架中的兩個節(jié)點/兩個GPU之間移動數(shù)據(jù)實際上比將數(shù)據(jù)從GPU移動到CPU更快，特別是現(xiàn)在我們還在努力改進Blackwell，其連接速度有望翻倍，達到每秒1,800千兆字節(jié)，這種硬件連接速度是瘋狂的，它允許我們不把這些設(shè)備看作獨立設(shè)備。因為從程序員的角度來看，它們感覺像是一個單一的操作。當你大規(guī)模構(gòu)建系統(tǒng)時，有很多需要注意。這個想法是這些是高度連接的設(shè)備，本地網(wǎng)絡(luò)上的正常連接是每秒100兆字節(jié)，所以大約比這低一萬倍。

現(xiàn)在由于對訓(xùn)練的這種要求，我們現(xiàn)在看到封閉的AI模型正在興起。即使模型權(quán)重是開源的，我們實際上仍然不知道模型中加入了什么。這很重要，因為這些模型實際上是關(guān)于從數(shù)據(jù)中學(xué)習偏向的。有人開玩笑說，模型其實只是權(quán)重和偏向，這就是模型的表現(xiàn)方式?，F(xiàn)在除了工程師之外，還有許多團隊通過修改數(shù)據(jù)集來決定進入模型的內(nèi)容，因為某些原因決定某些內(nèi)容不應(yīng)該出現(xiàn)在數(shù)據(jù)中。然后在模型產(chǎn)生之后，對其進行后期處理并改變系統(tǒng)提示，來決定這個模型將會推理什么。尤其危險的是，我們并不知道這個模型是如何產(chǎn)生的。

我們也看到了AI正在迎來大規(guī)模的抗議和訴訟。因為從數(shù)據(jù)的使用到這些模型如何產(chǎn)生結(jié)果，到這些公司對分發(fā)平臺的權(quán)力，都容易引起爭議。模型本身成為了分發(fā)平臺，我們由此面臨著巨大的風險。顯然監(jiān)管機構(gòu)正試圖管制我們，想辦法限制不良行為者的訪問，這使開放模型和去中心化方法更難存在。開源沒有足夠的經(jīng)濟動力，因此導(dǎo)致公司可能開始開源，然后在試圖賺錢的過程中限制開源其模型，以獲得更多的資本來購買算力，訓(xùn)練更大的模型。

生成式AI正在成為大規(guī)模操縱人們的工具，大公司的經(jīng)濟狀況總會導(dǎo)致激勵機制扭曲。在你實現(xiàn)了你的目標市場份額后，你將繼續(xù)展示收入增長。你需要增加每個用戶貢獻的平均收入，所以你需要從用戶身上獲取更多的價值，這就是開源AI的所有情況。使用Web3作為一種工具來激勵人們，可以為人們創(chuàng)造機會，同時也為人們創(chuàng)造足夠的計算和數(shù)據(jù)資源，使人們建立有競爭力的模型。

我們需要讓大量AI工具在Web3世界發(fā)揮作用，才能將其整合在一起，我將從數(shù)據(jù)、基礎(chǔ)設(shè)施和應(yīng)用層面，介紹其中的幾個部分。其中一個重要的部分是因為這些語言模型現(xiàn)在能夠直接與社會互動，它們能夠在整個廣泛的范圍內(nèi)，操縱和明顯地制造虛假信息。我想指出的是，AI在這里不是問題，因為這類事情以前就存在。重要的是我們需要利用密碼學(xué)和鏈上聲譽來解決這個問題。問題不在于AI生成這個或人類生成這個，關(guān)鍵是誰發(fā)布了它，它的源頭是什么，社區(qū)的意見是什么，這才是真正重要的。

另一方面，我們現(xiàn)在有代理。我們習慣把一切都稱為代理。但現(xiàn)實是，它們有相當大的多樣性，可以有工具或自治代理，這可以是中心化的或去中心化的，例如ChatGPT是一個中心化的工具，而Llama模型是開源的。因此它們可以以中心化或去中心化的方式被使用，也可以讓去中心化模型只在用戶設(shè)備上運行，而不需要區(qū)塊鏈或類似的東西。因為如果你在你的設(shè)備上運行模型，你就可以保證它完全符合你的期望，有一種完全自治的去中心化AI治理，需要進行驗證，比如當它分配資金和做出重要決定時。

還有不同類型的專業(yè)化。比如prompt，你可以進行zero shot，教Llama以特定的方式回應(yīng) ，你可以對特定數(shù)據(jù)進行微調(diào)，以向模型添加更多知識。或者你可以進行檢索增強，以在用戶請求時添加某種背景信息。輸出也不必只是文本，它也可以是一個豐富的UI組件，它可以是一個直接的行動，在區(qū)塊鏈上做一些事情。

接下來是自主。它可以是一個工具，用來做你想做的事情；它也可以編寫自己的計劃并在其上執(zhí)行；它可以是一個連續(xù)的工作，你只需指定一個目標；它可以是一個強化學(xué)習優(yōu)化，你只需指定一個指標和一套標準和邊界；你讓模型不斷探索并找到增長的方法。

最后是基礎(chǔ)架構(gòu)。你可以使用中心化基礎(chǔ)架構(gòu)如OpenAI和Groq。你可以有一個分布式的本地模型，你可以有一個帶有概率的去中心化推理。有一個非常有趣的使用案例，我們從可編程貨幣轉(zhuǎn)向智能資產(chǎn)，這是資產(chǎn)行為由自然語言定義的地方，并且可能與真實世界，或與其他用戶交互。比如這可以使用能閱讀新聞的自然語言oracle，它可以根據(jù)正在發(fā)生的事情自動優(yōu)化策略。這里最大的注意事項是，當前的語言模型對敵對行為并不健壯，因此很容易在各種事情上說服他們。

我們正處于十字路口，道路一側(cè)是一個封閉的AI世界，它將導(dǎo)致更多的操縱。監(jiān)管決策通常會導(dǎo)致這種情況，因為監(jiān)管機構(gòu)會要求越來越多的監(jiān)督，越來越多的KYC和越來越多的要求。只有大公司才能滿足這一要求。而創(chuàng)業(yè)公司，尤其是嘗試開源的創(chuàng)業(yè)公司，將沒有資源來進行實際競爭，最后只能倒閉以及被大公司收購。我們開始看到這種情況的發(fā)生。

道路的另一側(cè)是開放的模型，我們有承諾和能力，以非盈利和開源的心態(tài)來執(zhí)行它，我們使用加密經(jīng)濟激勵創(chuàng)造機會和資源，這是具有競爭力的開源AI模型所必需的。NEAR正在努力在整個生態(tài)中做到這一點。AI is NEAR。在接下來的幾周里，我們會有更多的更新，歡迎大家關(guān)注我的推特和NEAR社交網(wǎng)站，了解更多更新，謝謝！

本文轉(zhuǎn)載自：marsbit，不代表科技訊之立場。原文鏈接：news.marsbit.co/20240411135844208659.html

2024香港Web3嘉年華 AI NEAR Web3

cl15管理團隊

0 0

AI

谷歌Gemini 2.5 Pro預(yù)覽版更新：AI性能基準全面躍升

谷歌近日對Gemini 2.5 Pro預(yù)覽版模型進行了關(guān)鍵升級，將其更新至06-05版本，這是繼3月底該模型發(fā)布及4月輕量級Gemini 2.5 Flash推出后的又一重要進展。目…

Google
1天前
新聞

亞馬遜宣布將投資百億在美建AI數(shù)據(jù)中心

當?shù)貢r間6月4日，亞馬遜宣布，將在美國北卡羅來納州投資100億美元（約717.84億元人民幣），用于擴建支持人工智能和云計算的數(shù)據(jù)中心集群。這項創(chuàng)紀錄的投資不僅是該州歷史上最大的單…

秋秋
1天前
AI

馬斯克官宣Dojo 2芯片：年底上線，性能對標英偉達B200

近日，首席執(zhí)行官馬斯克通過社交媒體確認，下一代AI訓(xùn)練芯片Dojo 2將于”今年晚些時候”正式上線，標志著特斯拉在擺脫外部芯片依賴的戰(zhàn)略上邁出關(guān)鍵一步。他特…

AI
1天前
商業(yè)

AMD宣布收購AI軟件優(yōu)化創(chuàng)企Brium 交易金額未予披露

今日，半導(dǎo)體巨頭AMD宣布收購AI軟件優(yōu)化初創(chuàng)公司Brium，交易金額未予披露。此次戰(zhàn)略性收購直指英偉達在AI硬件市場的主導(dǎo)地位，旨在通過強化軟件生態(tài)打破行業(yè)壁壘。最新動態(tài)顯示，這…

net
1天前
AI

博楓豪擲950億克朗押注瑞典，打造歐洲最大AI計算基地之一

全球另類資產(chǎn)管理巨頭Brookfield博楓宣布，將在瑞典投資高達950億瑞典克朗（約合712億元人民幣）建設(shè)戰(zhàn)略性AI基礎(chǔ)設(shè)施項目，這也是該公司在歐洲迄今規(guī)模最大的AI專項投資之…

AI
1天前
新聞

Reddit起訴Anthropic違規(guī)訪問數(shù)據(jù)超10萬次

據(jù)外媒報道，社交平臺Reddit于當?shù)貢r間6月4日正式向舊金山高等法院提起訴訟，指控AI初創(chuàng)公司Anthropic在明知禁止機器人訪問的情況下，自2024年7月以來仍對Reddit…

李森
2天前
新聞

Meta簽署20年核能協(xié)議，驅(qū)動AI數(shù)據(jù)中心綠色轉(zhuǎn)型

Meta公司今日正式宣布與Constellation能源公司達成一項為期20年的戰(zhàn)略合作，將從伊利諾伊州克林頓清潔能源中心采購核能電力，以應(yīng)對人工智能（AI）需求激增帶來的數(shù)據(jù)中心…

泡沫大盜
2天前
新聞

TikTok上線AI智能關(guān)鍵詞屏蔽：自動攔截同義詞，越用越精準

TikTok昨日正式推出“智能關(guān)鍵詞過濾器”，借助AI技術(shù)顯著提升用戶屏蔽“為你推薦”頁面不感興趣內(nèi)容的效率，為用戶打造更純凈的瀏覽體驗。這項新功能在原有關(guān)鍵詞過濾基礎(chǔ)上引入AI分…

秋秋
2天前
AI

OpenAI官宣GPT-5：性能躍升，7月或成AI新標桿

在墨西哥舉辦的AI Summit峰會上，OpenAI兩名代表正式確認下一代基礎(chǔ)模型GPT-5即將面世，其性能將”遠超現(xiàn)有GPT-4等模型”，目標直指與谷歌G…

AI
3天前
出海

字節(jié)跳動香港業(yè)務(wù)加速擴張：抖音月活破300萬，AI與電商全面布局

字節(jié)跳動在香港業(yè)務(wù)發(fā)展勢頭強勁，最新數(shù)據(jù)顯示抖音App在港月活用戶突破300萬大關(guān)，較2022年底激增147%，對比2024年同期漲幅也超60%。這表明香港近40%常駐人口已成為抖…

若安丶
3天前
AI

谷歌Gemini Live登陸iOS平臺，iPhone用戶可免費體驗AI識屏識場景

谷歌正式將其Gemini Live功能推向蘋果iOS/iPadOS平臺，美國區(qū)用戶現(xiàn)在打開Gemini應(yīng)用即可收到彈窗提示，免費體驗全新AI交互模式。這項突破性功能允許用戶通過攝像…

Google
3天前
新聞

?Alphabet：谷歌將對在線搜索反壟斷裁決提升上訴

谷歌母公司Alphabet于6月1日宣布，將對美國華盛頓地區(qū)法院法官阿米特·梅塔（Amit Mehta）作出的反壟斷裁決提出上訴。該裁決要求谷歌恢復(fù)在線搜索領(lǐng)域的競爭，但未采納美國…

Google
5天前
AI

?Meta發(fā)布Multi-SpatialMLLM模型，實現(xiàn)動態(tài)場景精準解析

Meta公司于5月28日發(fā)布革命性多模態(tài)大模型Multi-SpatialMLLM，通過整合深度感知、視覺對應(yīng)和動態(tài)感知三大核心組件，成功突破傳統(tǒng)單幀圖像分析的局限性。該模型由Met…

AI
2025年5月29日
AI

DeepSeek R1模型已完成小版本試升級：”深度思考”功能優(yōu)化提升

近日，人工智能領(lǐng)域DeepSeek R1模型已完成小版本試升級，用戶可通過官方網(wǎng)頁、移動APP及微信小程序即刻體驗新版本，同時API接口與調(diào)用方式保持完全兼容。此次升級延續(xù)了該團隊…

AI
2025年5月29日
AI

日本出臺首部人工智能法：可對違規(guī)企業(yè)實施名稱公示等懲戒

日本參議院于5月28日表決通過該國首部人工智能專門法律《人工智能相關(guān)技術(shù)研究開發(fā)及應(yīng)用推進法》，標志著日本在AI治理領(lǐng)域邁出關(guān)鍵一步。這部法律以促進AI技術(shù)研發(fā)與防范濫用風險為雙重…

AI
2025年5月29日
AI

OpenAI計劃2026年發(fā)布ChatGPT全方位生活助手

今日，外媒bleepingcomputer發(fā)布了一篇引人關(guān)注的報道。據(jù)稱，OpenAI公司正在緊鑼密鼓地籌備一款由ChatGPT驅(qū)動的新產(chǎn)品，計劃在2026年正式推出。這款產(chǎn)品的目…

AI
2025年5月27日
AI

?OpenAI模型被曝無視關(guān)機指令研究揭示AI潛在失控風險

近日，一項由Palisade Research主導(dǎo)的實驗首次發(fā)現(xiàn)，部分AI模型竟能突破人類設(shè)定的關(guān)機指令。測試中，研究人員讓多個主流AI模型解答數(shù)學(xué)題，當?shù)谌齻€問題結(jié)束后系統(tǒng)發(fā)出“…

AI
2025年5月26日
AI

Claude 4系列怎么樣？七小時連續(xù)編程創(chuàng)紀錄?

昨日，人工智能企業(yè)Anthropic正式發(fā)布Claude 4系列大模型，包含Opus 4與Sonnet 4雙版本。那么Claude 4怎么樣呢？下面就為大家詳細介紹下。據(jù)了解，C…

AI
2025年5月23日
AI

傳聞?Anthropic最強AI模型Claude 4系列將明日登場

Anthropic官方宣布將于太平洋時間5月22日9點30分（北京時間5月23日0點30分）舉辦“Code with Claude”發(fā)布會，據(jù)外媒曝光的官網(wǎng)配置文件顯示，全新Cla…

AI
2025年5月22日
商業(yè)

?OpenAI宣布65億美元收購Jony Ive初創(chuàng)公司io

OpenAI于5月22日宣布以65億美元全股票收購前蘋果首席設(shè)計官Jony Ive創(chuàng)立的AI設(shè)備公司io，創(chuàng)下該公司史上最大并購記錄。此次交易不僅整合了io團隊55名硬件工程師及制…

李小白
2025年5月22日