亞馬遜云AWS推出新一代自研芯片和AI聊天機器人,加強與英偉達的合作

亞馬遜云計算業(yè)務(wù)AWS在本周二的年度大會re:Invent上發(fā)布了一系列新產(chǎn)品和服務(wù),展示了其在云計算和人工智能領(lǐng)域的創(chuàng)新能力和領(lǐng)先地位。AWS推出了新一代的通用芯片Graviton4和AI芯片Trainium2,以及基于生成式AI技術(shù)的聊天機器人Q。同時,AWS還宣布了與英偉達的深入合作,將在云上部署英偉達的最新超級芯片Grace Hopper,提供更強大的AI計算能力和服務(wù)。

亞馬遜云AWS推出新一代自研芯片和AI聊天機器人,加強與英偉達的合作

Graviton4是AWS自研的第四代通用芯片,其計算性能較前代提高多達30%,內(nèi)核增加50%,內(nèi)存帶寬提升75%。Graviton4還通過對所有高速物理硬件接口進行完全加密提高安全性。Graviton4將應(yīng)用于內(nèi)存優(yōu)化的Amazon EC2 R8g 實例,讓客戶能改進高性能數(shù)據(jù)庫、內(nèi)存緩存和大數(shù)據(jù)分析工作負載的執(zhí)行。Graviton4的電腦將在未來數(shù)月內(nèi)上市。

Trainium2是AWS自研的第二代AI芯片,其速度比前代快四倍,將能在EC2 UltraCluster中部署多達10萬個芯片,讓用戶能在很短的時間內(nèi)訓(xùn)練數(shù)以萬億參數(shù)的基礎(chǔ)模型(PM)和大語言模型 (LLM),同時能源利用率較前代提高多達兩倍。Trainium2 將用于Amazon EC2 Trn2 實例,單個實例中包含16 個Trainium 芯片。Trn2 實例旨在幫助客戶在下一代 EC2 UltraCluster中擴展芯片應(yīng)用數(shù)量至多達10萬個Trainium2 芯片,聯(lián)通AWS Elastic Fabric Adapter (EFA) petabit級網(wǎng)絡(luò),提供高達 65 exaflops 的算力。Trainium2將從明年開始用于支持新的服務(wù)。

Q是AWS推出的基于生成式AI技術(shù)的聊天機器人,可根據(jù)企業(yè)客戶的業(yè)務(wù)進行工作,幫助企業(yè)客戶搜索信息、編寫代碼和審查業(yè)務(wù)指標(biāo)。Q接受了AWS內(nèi)部有關(guān)代碼和文檔的部分培訓(xùn),可供AWS云的開發(fā)者使用。開發(fā)者可以用Q在AWS上創(chuàng)建App、研究最佳實踐、改正錯誤、獲得為App編寫新功能的幫助。用戶可以通過對話式的問答功能與Q進行交互,學(xué)習(xí)新知識、研究最佳實踐以及了解如何在AWS上構(gòu)建App,無需將注意力從 AWS 控制臺上移開。Q還將被添加到亞馬遜的企業(yè)智能軟件、呼叫中心工作人員和物流管理的程序。Q 對話式問答功能目前在所有提供企業(yè)AWS的地區(qū)提供預(yù)覽版。

除了自研芯片和AI聊天機器人,AWS還與英偉達加強了戰(zhàn)略合作,將在云上部署英偉達的最新超級芯片Grace Hopper,提供更強大的AI計算能力和服務(wù)。Grace Hopper是英偉達的第三代數(shù)據(jù)中心GPU,其性能較前代提高了10倍,可支持萬億參數(shù)級的AI模型。AWS將成為第一家在云上采用全新多節(jié)點NVLink技術(shù)英偉達H200 Grace Hopper超級芯片的云服務(wù)商。英偉達的H200 NVL32 多節(jié)點平臺將 32 個 Grace Hopper芯片與 NVLink 和 NVSwitch 技術(shù)共同用于一個實例。該平臺將用于與亞馬遜網(wǎng)絡(luò)EFA連接的Amazon EC2實例,并由高級虛擬化 (AWS Nitro System) 和超大規(guī)模集群 (Amazon EC2 UltraClusters) 提供支持,使亞馬遜和英偉達共同的客戶能夠擴展部署數(shù)以千計的H200芯片。

英偉達和AWS還將共同在AWS上托管英偉達的AI 訓(xùn)練即服務(wù)DGX Cloud,它將是第一個采用GH200 NVL32 的 DGX 云,能為開發(fā)人員提供單個實例中最大的共享內(nèi)存。AWS 的DGX云將提高尖端生成式AI 和超過1萬億參數(shù)的大語言模型的訓(xùn)練。此外,英偉達和AWS 正在共同研發(fā)名為Ceiba 的項目,設(shè)計世界上速度最快的GPU驅(qū)動AI 超級計算機,這是一個采用 GH200 NVL32 和 Amazon EFA 互連的大規(guī)模系統(tǒng)。它是搭載1.6384萬塊GH200超級芯片的超級計算機 ,AI處理能力達65 exaflops。英偉達將用它推動下一波生成式AI 創(chuàng)新。

AWS的副總裁Dave Brown表示,通過將自研芯片的設(shè)計重點放在對客戶重要的實際工作負載上,AWS能為他們提供最先進的云基礎(chǔ)設(shè)施。他還表示,AWS和英偉達的合作將為客戶提供更多的選擇和靈活性,讓他們能夠利用最新的AI技術(shù)來解決最復(fù)雜的問題。拼多多的創(chuàng)始人兼CEO黃崢在財報發(fā)布后表示:“我們很高興看到我們的業(yè)績持續(xù)強勁增長,反映了我們的平臺的吸引力和活力。我們將繼續(xù)專注于為我們的用戶提供更多的價值和更好的體驗,同時為我們的商家和品牌提供更多的機會和支持。我們相信,通過不斷地創(chuàng)新和改進,我們將能夠?qū)崿F(xiàn)我們的愿景,讓農(nóng)民和消費者直接受益,讓電商更加普惠和可持續(xù)。”

原創(chuàng)文章,作者:商業(yè)頭條,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/599843.html

商業(yè)頭條的頭像商業(yè)頭條認證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論