寒武紀思元370通過芯粒技術(shù)適配多樣場景需求

思元 370 是寒武紀首款采用 chiplet(芯粒)技術(shù)的 AI 芯片,應(yīng)該也是國內(nèi)首顆 chiplet AI 芯片?;谂_積電 7nm 制程工藝,整體集成了 390 億個晶體管,最大算力達到 256TOPS(INT8),這一數(shù)據(jù)是

思元 370 是寒武紀首款采用 chiplet(芯粒)技術(shù)的 AI 芯片,應(yīng)該也是國內(nèi)首顆 chiplet AI 芯片。基于臺積電 7nm 制程工藝,整體集成了 390 億個晶體管,最大算力達到 256TOPS(INT8),這一數(shù)據(jù)是寒武紀第二代產(chǎn)品思元 270 算力的 2 倍。

憑借寒武紀最新智能芯片架構(gòu) MLUarch03,相較于峰值算力的提升,思元 370 實測性能表現(xiàn)非常亮眼:同功率性能超過 T4 兩倍還多,完成同樣的任務(wù),功耗可以是 A10 的一半。

此外,寒武紀還基于思元370智能芯片的技術(shù),通過Chiplet(芯粒)技術(shù),靈活組合產(chǎn)品的特性,適配出符合不同場景需求的三款加速卡,包括:MLU370-S4、MLU370-X4和MLU370-X8。

具體來說,MLU370-S4為半高半長單槽位加速卡,板卡功耗為75W,可面向機器視覺/推理任務(wù),適合于對計算密度要求較高的數(shù)據(jù)中心場景。

而MLU370-X4為單槽位150W全尺寸加速卡,可提供256TOPS(INT8)推理算力和24TFLOPS(FP32)訓練算力,同時提供FP16、BF16等多種訓練精度,主要面向互聯(lián)網(wǎng)行業(yè)等推理任務(wù)或訓推一體場景,適合于對單卡算力需求較高的應(yīng)用場景。

MLU370-X8則采用雙芯思元370配置,為雙槽位250W全尺寸加速卡,可提供24TFLOPS(FP32)訓練算力和256TOPS(INT8)推理算力,同時提供豐富的FP16、BF16等多種訓練精度,主要面向?qū)λ懔蛶捯筝^高的訓練任務(wù)。在業(yè)界應(yīng)用廣泛的YOLOv3、Transformer等訓練任務(wù)中,8卡計算系統(tǒng)的并行性能平均達到350W RTX GPU的155%。

寒武紀思元370通過芯粒技術(shù)適配多樣場景需求

總而言之,寒武紀在同樣的研發(fā)費用之下,滿足了更多元的市場需求。

據(jù)了解,寒武紀是智能芯片領(lǐng)域全球知名的新興公司,主營業(yè)務(wù)是各類云服務(wù)器、邊緣計算設(shè)備、終端設(shè)備中人工智能核心芯片的研發(fā)、設(shè)計和銷售,通過向客戶提供芯片及加速卡產(chǎn)品、訓練整機、智能計算集群系統(tǒng)、IP授權(quán)及軟件獲取業(yè)務(wù)收入。

成立以來,寒武紀一直根據(jù)市場和客戶的需求,加強研發(fā)創(chuàng)新投入力度,持續(xù)升級迭代云邊端系列化產(chǎn)品及基礎(chǔ)系統(tǒng)軟件平臺,豐富公司的產(chǎn)品矩陣,以適應(yīng)不同的人工智能應(yīng)用場景。

(本內(nèi)容屬于網(wǎng)絡(luò)轉(zhuǎn)載,文中涉及圖片等內(nèi)容如有侵權(quán),請聯(lián)系編輯刪除。市場有風險,選擇需謹慎!此文僅供參考,不作買賣及投資依據(jù)。)

原創(chuàng)文章,作者:陳晨,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/563565.html

陳晨陳晨管理團隊

相關(guān)推薦