AMD ROCm 7正式亮相 助力DeepSeek R1效率躍升3.8倍

AMD ROCm 7正式亮相 助力DeepSeek R1效率躍升3.8倍

AMD今日凌晨(6月13日)舉辦的Advancing AI 2025大會上,全新開源軟件棧ROCm 7正式亮相,聚焦開發(fā)者生產(chǎn)力與AI推理效率突破。此次升級終結(jié)了ROCm 6的長期迭代周期,重點強化五大功能模塊:最新算法模型、AI擴展能力、MI350系列硬件支持、集群管理及企業(yè)級功能,顯著優(yōu)化大模型運行效能。

與其配套的增強型框架vLLM v1、llm-d和SGLang,結(jié)合GEMM自動調(diào)優(yōu)、MoE專家系統(tǒng)等新內(nèi)核,共同構(gòu)建高效推理生態(tài)。尤為關(guān)鍵的是,ROCm 7全面支持FP4/FP6/FP8低精度格式及混合精度運算,完美匹配同日發(fā)布的MI350系列GPU硬件特性,該芯片采用CDNA4架構(gòu)與3nm工藝,推理性能較前代提升35倍。

性能實測數(shù)據(jù)引發(fā)行業(yè)關(guān)注:對比ROCm 6,新版本在Llama 3.1 70B上實現(xiàn)3.2倍加速,Qwen2-72B提升3.4倍,而國產(chǎn)大模型DeepSeek R1推理效率暴漲3.8倍,創(chuàng)下本次升級最大增幅。值得關(guān)注的是,搭載ROCm 7的MI355X在與競品對比中展現(xiàn)出40%的每美元詞元生成優(yōu)勢,凸顯性價比競爭力。

隨著AMD推動開放AI生態(tài)愿景,ROCm 7的落地有望打破現(xiàn)有市場格局。蘇姿豐在大會強調(diào):”2028年數(shù)據(jù)中心AI加速器市場將達5000億美元”,此番技術(shù)躍進正是AMD角逐萬億賽道的關(guān)鍵落子。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/723773.html

AI的頭像AI認證作者

相關(guān)推薦

發(fā)表回復

登錄后才能評論