焱融存儲(chǔ)YRCloudFile發(fā)布面向AI推理的分布式KV Cache特性

陳晨 ? 2025年3月19日 09:14:35 ? 產(chǎn)經(jīng)

AI 存儲(chǔ)廠商焱融科技宣布，其自主研發(fā)的分布式文件存儲(chǔ)系統(tǒng) YRCloudFile 已成功支持大模型推理場(chǎng)景的 KV Cache 特性，為 AI 推理帶來顯著價(jià)值提升。

KV Cache 通過高效緩存機(jī)制加速數(shù)據(jù)讀取，顯著提升推理性能，突破 GPU 顯存瓶頸，大幅提升推理 GPU 效率和并發(fā)處理能力。這意味著用戶可以在不增加 GPU 資源的情況下，實(shí)現(xiàn)更高并發(fā)的推理請(qǐng)求，大幅降低 GPU 資源消耗與投入成本。同時(shí)，它還能夠降低推理的首個(gè) Token 耗時(shí)和 Token 間耗時(shí)延時(shí)，提升用戶使用體驗(yàn)。

此外，焱融科技實(shí)現(xiàn)了 DeepSeek 級(jí)架構(gòu)，構(gòu)建與 DeepSeek 一致的推理場(chǎng)景存算參考架構(gòu)。用戶在使用支持 KV Cache 的焱融存儲(chǔ)時(shí)，能夠享受到與 DeepSeek 同等架構(gòu)帶來的優(yōu)質(zhì)體驗(yàn)。在相同規(guī)模和推理速度下，焱融存儲(chǔ)支持更長的上下文處理和更多查詢請(qǐng)求，為大模型推理提供更優(yōu)的性價(jià)比。

焱融存儲(chǔ)支持 KV Cache 技術(shù)新優(yōu)勢(shì)

優(yōu)勢(shì)一｜焱融 AI 推理存儲(chǔ)優(yōu)化實(shí)時(shí)交互性能

在實(shí)時(shí)交互場(chǎng)景中，用戶對(duì) AI 服務(wù)的響應(yīng)速度要求極高。焱融存儲(chǔ) KV Cache 技術(shù)，大幅縮短大模型推理的首個(gè)Token耗時(shí)（Time To First Token）和Token間耗時(shí)（Time Between Token），顯著提升復(fù)雜場(chǎng)景的響應(yīng)效率。該方案采用 NVMe SSD 加速與高性能網(wǎng)絡(luò)，實(shí)現(xiàn)微秒級(jí)推理延遲，提升 Token 處理速度，減少資源占用，支持更多并發(fā)訪問，優(yōu)化業(yè)務(wù)成本。同時(shí)，通過 GPUDirect Storage 與 RDMA 網(wǎng)絡(luò)的結(jié)合進(jìn)一步優(yōu)化數(shù)據(jù)傳輸效率，提升用戶體驗(yàn)。

優(yōu)勢(shì)二｜顯存資源動(dòng)態(tài)優(yōu)化與推理加速

焱融存儲(chǔ) KV Cache 技術(shù)，突破顯存容量對(duì)上下文長度的限制，實(shí)現(xiàn) GPU 資源動(dòng)態(tài)調(diào)度，提升單卡并發(fā)推理能力。這意味著用戶可以在不增加 GPU 資源的情況下，實(shí)現(xiàn)更高并發(fā)的推理請(qǐng)求，大幅降低 GPU 資源消耗與投入成本。目前，該技術(shù)已應(yīng)用于多模態(tài)大模型、實(shí)時(shí)交互等高算力需求場(chǎng)景，為 AGI 時(shí)代規(guī)?；?AI 落地提供高性價(jià)比的算力底座。

優(yōu)勢(shì)三｜DeepSeek 級(jí)架構(gòu)體驗(yàn)

針對(duì)當(dāng)前企業(yè)廣泛采用的 DeepSeek 等主流大模型，焱融存儲(chǔ) KV Cache 技術(shù)進(jìn)一步降低企業(yè)使用成本的同時(shí)，提升推理場(chǎng)景下的響應(yīng)效率?？伸`活適配從百億級(jí)參數(shù)模型到萬億級(jí) MoE 混合專家模型，滿足政務(wù)、金融等高安全要求場(chǎng)景的數(shù)據(jù)本地化需求，同時(shí)支持國產(chǎn)與海外芯片的異構(gòu)算力環(huán)境，為企業(yè)提供自主可控的技術(shù)路徑。

此次技術(shù)突破正值國內(nèi)企業(yè) AI 私有化部署浪潮，焱融科技以存儲(chǔ)技術(shù)創(chuàng)新推動(dòng)算力資源的高效利用，為 AI 規(guī)?；瘧?yīng)用提供了關(guān)鍵基礎(chǔ)設(shè)施支撐。隨著多模態(tài)與實(shí)時(shí)交互場(chǎng)景的普及，存儲(chǔ)與計(jì)算的協(xié)同優(yōu)化，KVCache“以存換算”將成為企業(yè)降本增效的核心競(jìng)爭(zhēng)力。

本文轉(zhuǎn)載自：，不代表科技訊之立場(chǎng)。原文鏈接：http://articlef.yulepops.com/article/m-164/1/312202503181757442436386.html

陳晨管理團(tuán)隊(duì)

0 0

孤勇者白象：把“圍獵”變成“趕考”

這幾年，從蜜雪冰城到泡泡瑪特，從胖東來到白象食品，河南的消費(fèi)品品牌不斷成為商界和社會(huì)關(guān)注的亮點(diǎn)。亮點(diǎn)往往也連著熱點(diǎn)。前不久，當(dāng)于東來面對(duì)“柴懟懟”對(duì)胖東來玉石銷售的無端中傷時(shí)，他…

陳晨
產(chǎn)經(jīng) 9小時(shí)前
創(chuàng)維光伏E企贏開啟企業(yè)用電0成本時(shí)代，引領(lǐng)全民光伏普惠變革

在全球能源轉(zhuǎn)型的關(guān)鍵節(jié)點(diǎn)，中國工業(yè)企業(yè)正面臨著能源成本攀升與綠色轉(zhuǎn)型的雙重挑戰(zhàn)。隨著《中華人民共和國能源法》的正式通過，國家明確支持優(yōu)先開發(fā)利用可再生能源，提高非化石能源消費(fèi)比重，…

陳晨
產(chǎn)經(jīng) 11小時(shí)前
產(chǎn)經(jīng)

微信再上新鴻蒙生態(tài)展現(xiàn)加速迭代強(qiáng)勁動(dòng)力

國民軟件微信在鴻蒙系統(tǒng)中再迎重磅更新，切實(shí)關(guān)切用戶呼聲。 6月6日，根據(jù)華為官方消息，鴻蒙版微信升級(jí)到了1.0.7.35版本，需要指出的是，此次升級(jí)后的版本著重對(duì)于用戶需求強(qiáng)烈、使…

陳晨
12小時(shí)前
產(chǎn)經(jīng)

全國愛眼日天馬在行動(dòng)：五大維度定義護(hù)眼“好屏”新標(biāo)準(zhǔn)

數(shù)字時(shí)代，智能顯示設(shè)備深度嵌入大眾生活，成為不可或缺的“體外器官”。據(jù)Ipsos調(diào)研數(shù)據(jù)，2024年全球人均手機(jī)使用時(shí)長高達(dá)4小時(shí)，預(yù)計(jì)2050年全球近視人數(shù)占比超過50%。過度用…

陳晨
17小時(shí)前
產(chǎn)經(jīng)

沐光發(fā)布全屋健康智能燈光系統(tǒng)，兩大技術(shù)革新開啟健康照明 2.0 時(shí)代

近日，亞洲權(quán)威頂級(jí)設(shè)計(jì)盛會(huì)—“設(shè)計(jì)上海2025”落下帷幕，來自30多個(gè)國家及地區(qū)的600余品牌的設(shè)計(jì)精品，呈現(xiàn)前沿的設(shè)計(jì)理念。吸引超8萬名專業(yè)觀眾，到場(chǎng)親身感受設(shè)計(jì)的魅力。專注健康…

陳晨
1天前
產(chǎn)經(jīng)

高考Agent來了，華為瀏覽器高考頻道上新

在今年高考季，小藝協(xié)同華為瀏覽器推出高考Agent問答服務(wù)。華為瀏覽器作為終端設(shè)備上全球資訊的便捷入口，在權(quán)威資訊的基礎(chǔ)上，基于AI Agent能力，在高考日程、院校信息、歷年真題…

陳晨
1天前
產(chǎn)經(jīng)

全新高考Agent問答服務(wù)！華為瀏覽器小藝高考通上線

在今年高考季，小藝協(xié)同華為瀏覽器推出高考Agent問答服務(wù)。華為瀏覽器作為終端設(shè)備上全球資訊的便捷入口，在權(quán)威資訊的基礎(chǔ)上，基于AI Agent能力，在高考日程、院校信息、歷年真題…

陳晨
1天前
產(chǎn)經(jīng)

從“臨時(shí)搭子”到“長期閨蜜”：酷開AI閨蜜機(jī)重新定義智能生活

在快節(jié)奏的都市生活中，年輕人正經(jīng)歷著一場(chǎng)微妙的消費(fèi)觀革命。當(dāng)“斷舍離”的極簡(jiǎn)主義撞上“智能焦慮”的信息洪流，人們開始厭倦那些“一次性工具”般的科技產(chǎn)品，轉(zhuǎn)而尋找能真正融入生活、實(shí)現(xiàn)…

陳晨
1天前
產(chǎn)經(jīng)

全國愛眼日天馬在行動(dòng)：五大維度定義護(hù)眼“好屏”新標(biāo)準(zhǔn)

數(shù)字時(shí)代，智能顯示設(shè)備深度嵌入大眾生活，成為不可或缺的“體外器官”。據(jù)Ipsos調(diào)研數(shù)據(jù)，2024年全球人均手機(jī)使用時(shí)長高達(dá)4小時(shí)，預(yù)計(jì)2050年全球近視人數(shù)占比超過50%。過度用…

陳晨
1天前
產(chǎn)經(jīng)

第30個(gè)全國愛眼日易視界聯(lián)合河南廣播電視臺(tái)發(fā)起愛眼公益活動(dòng)

2025年6月6日，在第30個(gè)全國愛眼日來臨之際，易視界聯(lián)合河南廣播電視臺(tái)都市生活事業(yè)部，特別策劃了一場(chǎng)溫暖且實(shí)用的“關(guān)注普遍的眼健康”公益活動(dòng)。活動(dòng)現(xiàn)場(chǎng)，易視界專業(yè)團(tuán)隊(duì)為市民提…

陳晨
1天前
產(chǎn)經(jīng)

百年奢品家電ASKO閃耀“設(shè)計(jì)上海”2025 探尋可持續(xù)奢居未來

6月4日–7日，“設(shè)計(jì)上海”2025在上海世博展覽館盛大開幕，匯聚全球頂尖設(shè)計(jì)師與品牌，共同探討未來設(shè)計(jì)的無限可能。在這場(chǎng)匯聚全球設(shè)計(jì)智慧的盛宴中，百年奢品家電ASKO…

陳晨
1天前
136萬人圍觀董明珠淘寶直播首秀新中式空調(diào)、琺瑯鍋爆火出圈

6月5日晚，136萬人在線圍觀董明珠淘寶直播首秀，新中式空調(diào)、琺瑯鍋、鮮花冰箱等多款格力產(chǎn)品爆火出圈。在探店“董明珠健康家”直播中，董明珠力推國風(fēng)山水系列空調(diào)，并親自用絲巾演示“…

陳晨
產(chǎn)經(jīng) 2天前
產(chǎn)經(jīng)

“煥”醒亮度，“包”您滿意！愛普生家用投影機(jī)換燈服務(wù)包全新上線

在這個(gè)視覺至上的時(shí)代，您的“家庭影院“是否還能呈現(xiàn)多年前如初的震撼畫質(zhì)？愛普生深諳用戶的品質(zhì)需求，全新推出家用燈泡型號(hào)投影機(jī)換燈服務(wù)包，并于2025年4月正式入駐愛普生家用投影小助…

陳晨
2天前
第五屆平潭IM兩岸青年影展聯(lián)合即夢(mèng)AI發(fā)起“AIGC單元”

近日，第五屆平潭IM兩岸青年影展宣布首設(shè)“AIGC單元”，由即夢(mèng)AI聯(lián)合發(fā)起，面向全球華人青年創(chuàng)作者征集AI短片作品，以“未來已來”為主題探索科技與影像藝術(shù)的融合可能。 IM兩岸青…

陳晨
產(chǎn)經(jīng) 2天前
百度智能云發(fā)布千帆慧金金融大模型

6月6日,在人民日?qǐng)?bào)文化傳媒有限公司和百度聯(lián)合主辦的2025智能經(jīng)濟(jì)論壇上,百度智能云發(fā)布千帆慧金金融大模型。針對(duì)金融行業(yè)應(yīng)用中的專業(yè)需求,該模型基于海量金融語料深度訓(xùn)練,構(gòu)建金融…

陳晨
產(chǎn)經(jīng) 2天前
產(chǎn)經(jīng)

2025世俱杯正確打開方式！海信100吋大屏賣爆：客廳秒變現(xiàn)場(chǎng)

　　2025世俱杯馬上進(jìn)入倒計(jì)時(shí)，全世界球迷的心將再度沸騰。誰不想去現(xiàn)場(chǎng)零距離體驗(yàn)獨(dú)屬于足球的激情？雖然廣大球迷只能蹲守直播，但有了海信100吋大屏助力，客廳也能變球場(chǎng)！　　剛過…

科技探索者
2天前
產(chǎn)經(jīng)

科大訊飛“聽見AI的聲音”6周年，和萬茜一起關(guān)注聽障群體，聽見更大的世界

6月6日，科大訊飛“聽見AI的聲音”關(guān)愛聽障人士公益行動(dòng)正式迎來六周年。今年，訊飛聽見與中國聾人協(xié)會(huì)、中國殘疾人藝術(shù)團(tuán)、演員萬茜繼續(xù)攜手，攜手呼吁大家關(guān)注聽障群體。由科大訊飛聯(lián)合…

陳晨
2天前
產(chǎn)經(jīng)

科技照亮銀發(fā)生活創(chuàng)新編織幸福晚年

在老齡化浪潮日益洶涌的今天,如何為銀發(fā)一族構(gòu)筑一個(gè)安心、愜意、便利的居住天地,已成為全社會(huì)共同矚目的課題。富德生命人壽,以“美好生活”居家養(yǎng)老服務(wù)為突破口,憑借產(chǎn)品的科技賦能與創(chuàng)新…

陳晨
2天前
產(chǎn)經(jīng)

高效應(yīng)對(duì)考試三星Galaxy Tab S10系列做你的AI學(xué)習(xí)搭檔

高考季如約而至，考場(chǎng)內(nèi)學(xué)子們奮筆疾書，場(chǎng)外的人們也對(duì)這場(chǎng)年度大考保持熱烈關(guān)注。尤其是那些目前仍處于備戰(zhàn)階段的高二學(xué)生，一年后他們也將奮戰(zhàn)在沖刺的戰(zhàn)場(chǎng)上，如何在接下來的階段提升成績(jī)成…

陳晨
2天前
產(chǎn)經(jīng)

聯(lián)合國KIP國際學(xué)院主席法比亞諾先生一行參訪沃民高科,共探中醫(yī)AI融合創(chuàng)新

5月29日下午,聯(lián)合國KIP國際學(xué)院主席、意大利前外交部副部長法比亞諾先生一行到訪沃民高新科技(北京)股份有限公司及旗下子公司北京心扁鵲連鎖運(yùn)營管理有限公司。在公司董事長齊中祥及海…

陳晨
2天前

發(fā)表回復(fù)

登錄后才能評(píng)論

焱融存儲(chǔ)YRCloudFile發(fā)布面向AI推理的分布式KV Cache特性

相關(guān)推薦

發(fā)表回復(fù)