近日,全球權(quán)威 AI 基準(zhǔn)測評組織 MLCommons? 公布了 MLPerf? v1.0 存儲性能基準(zhǔn)測試的結(jié)果。焱融科技在此次測試中表現(xiàn)出色,焱融全閃存儲產(chǎn)品在 3D-Unet、ResNet50 和 CosmoFlow 三種 AI 深度學(xué)習(xí)模型的評估中均展現(xiàn)了卓越的性能和效率。

焱融科技作為中國自主研發(fā)的高性能存儲領(lǐng)導(dǎo)者,與 DDN、Nutanix、Weka、Hammerspace、Solidigm 和 Micron 等眾多國際優(yōu)秀廠商同場競技,測試結(jié)果顯示,在帶寬、模擬 GPU 數(shù)量以及 GPU 利用率等關(guān)鍵性能指標(biāo)上,焱融科技的產(chǎn)品獲得了多項世界第一。

在 MLPerf? Storage v1.0 的基準(zhǔn)測試中,焱融全閃存儲顯著提升了 GPU/ML 工作負(fù)載的處理速度,這表明焱融高性能存儲產(chǎn)品具備支持各種 AI 模型訓(xùn)練和高性能計算場景的能力。在 AI 領(lǐng)域,尤其是在大規(guī)模模型訓(xùn)練方面,焱融全閃存存儲解決方案發(fā)揮著至關(guān)重要的作用,為 AI 技術(shù)的發(fā)展和應(yīng)用提供了強有力的支持。
MLPerf? Storage 全球首個且唯一的 AI/ML 存儲基準(zhǔn)測試
MLPerf 是由圖靈獎得主大衛(wèi)·帕特森(David Patterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等頂尖學(xué)術(shù)機構(gòu)共同發(fā)起的國際權(quán)威 AI 性能基準(zhǔn)測試,被譽為全球 AI 領(lǐng)域的“奧運會”。MLCommons 組織在 2023 年首次推出了 MLPerf 存儲基準(zhǔn)測試(MLPerf Storage Benchmark),這是首個也是目前唯一一個開源、公開透明的 AI/ML 基準(zhǔn)測試,旨在評估存儲系統(tǒng)在 ML/AI 工作負(fù)載中的表現(xiàn)。這一基準(zhǔn)測試為 ML/AI 模型開發(fā)者選擇存儲解決方案提供了權(quán)威的參考依據(jù),幫助他們評估合適的存儲產(chǎn)品。
MLPerf Storage 基準(zhǔn)測試目前有兩個版本:v0.5 和 v1.0。2023 年發(fā)布的 v0.5 版本初步包含了 Unet-3D 和 BERT 兩個模型,并僅支持模擬 NVIDIA v100 GPU。而今年最新發(fā)布的 v1.0 版本進行了重大更新,引入了更具代表性的測試模型,這些模型在業(yè)界具有廣泛的應(yīng)用,能夠更好地代表實際工作負(fù)載。

焱融存儲是國內(nèi)唯一全面參與所有模型測試的廠商 榮登多項世界第一
焱融科技參與 MLPerf 測試使用了最新發(fā)布的 F9000X 全閃分布式一體機產(chǎn)品。F9000X 每個存儲節(jié)點搭載最新的英特爾? 至強? 第 5 代可擴展處理器,存儲介質(zhì)采用 10 塊 Memblaze PCIE 5.0 NVMe 閃存 ,同時配備 2 塊 NVIDIA ConnectX-7 400Gb NDR 網(wǎng)卡。
最全面最完整,國內(nèi)唯一一家參加了全部模型測試的存儲廠商
焱融科技是國內(nèi)唯一一家參與了 MLPerf Storage 全部模型測試的存儲廠商,包括 3D-Unet、CosmoFlow 和 ResNet 50。在測試環(huán)節(jié)中,焱融追光全閃存儲一體機 F9000X 展現(xiàn)了卓越的性能,全面覆蓋目前主流模型應(yīng)用數(shù)據(jù)負(fù)載需求。F9000X 不僅能夠處理大規(guī)模的數(shù)據(jù)集,還可以根據(jù) AI 集群規(guī)模彈性擴展,完美匹配 GPU 算力性能。
在分布式訓(xùn)練集群場景,平均每個計算節(jié)點 ACC 數(shù)量最多,存儲帶寬最高
MLPerf Storage 基準(zhǔn)測試規(guī)則定義可以采用單個計算節(jié)點(客戶端)運行多個 ACC(Accelerator,GPU 加速器),進行相應(yīng)模型應(yīng)用測試,同時支持大規(guī)模分布式訓(xùn)練集群場景,多個客戶端模擬真實數(shù)據(jù)并行的方式并發(fā)訪問存儲集群。其中平均每個客戶端能夠運行的 ACC 數(shù)量越多,則代表該節(jié)點的計算能力越強,能夠處理任務(wù)的數(shù)量也就越多,而對于存儲數(shù)據(jù)并發(fā)訪問性能要求也就越高。測試結(jié)果顯示,在分布式訓(xùn)練集群場景,焱融存儲在所有三個模型的測試中,能夠支撐的每個計算節(jié)點平均 ACC 數(shù)量和存儲帶寬性能均排名第一。


存儲性能隨計算規(guī)模同步線性增長
隨著計算規(guī)模的擴大,存儲性能應(yīng)實現(xiàn)線性增長以滿足 AI 訓(xùn)練的需求。以 3D-Unet 三維圖像分割模型為例,其單個圖像樣本大小約為 146MB,而在多節(jié)點集群環(huán)境中,每秒處理的訓(xùn)練樣本數(shù)可超過 1100 個,這導(dǎo)致訓(xùn)練數(shù)據(jù)的讀取帶寬需求超過 160GB/s。
在針對三個模型的測試中,焱融全閃存儲一體機 F9000X 展現(xiàn)了出色的性能。測試結(jié)果顯示:隨著并發(fā)計算節(jié)點(ACC)數(shù)量的增加,存儲系統(tǒng)的帶寬性能保持明顯的線性增長能力。此外,存儲的可用性(AU,Accelerator Utilization,GPU 加速器利用率)也始終保持在測試基準(zhǔn)要求的范圍內(nèi),確保了訓(xùn)練過程的高效和穩(wěn)定。目前在 3D-Unet 模型應(yīng)用的測試中,使用 3 個計算節(jié)點,共 60 個 ACC,可達到 160GB/s 的存儲帶寬性能。F9000X 3 節(jié)點存儲集群實測最大可以達到 260GB/s 以上的帶寬性能,這表明在實際業(yè)務(wù)環(huán)境中焱融全閃存可以支撐更多的 GPU 的計算節(jié)點。
焱融科技在AI和高性能計算領(lǐng)域,憑借其深厚的技術(shù)積累和持續(xù)創(chuàng)新,已成為推動行業(yè)發(fā)展的關(guān)鍵力量。在MLPERF Storage V1.0基準(zhǔn)測試中,焱融科技首次參與便取得領(lǐng)先地位,標(biāo)志著其數(shù)據(jù)存儲技術(shù)達到行業(yè)新高度。焱融科技的全閃分布式存儲一體機追光F9000X,以其卓越的性能滿足了日益增長的高性能計算需求,實現(xiàn)了數(shù)據(jù)存儲領(lǐng)域的重大突破。這一產(chǎn)品不僅提升了數(shù)據(jù)處理能力,還為人工智能、高性能計算、自動駕駛、生物信息分析和金融量化等前沿領(lǐng)域的發(fā)展提供了強大支持。
本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:http://articlef.yulepops.com/article/m-164/1/312202409291741341774524.html