一文揭秘：火山引擎云基礎(chǔ)設(shè)施如何支撐大模型應(yīng)用落地

陳晨 ? 2024年8月26日 20:42:43 ? 產(chǎn)經(jīng)

2024年被普遍認(rèn)為是“大模型落地應(yīng)用元年”，而要讓大模型真正落地應(yīng)用到企業(yè)的生產(chǎn)環(huán)節(jié)中，推理能力至關(guān)重要。所謂“推理能力”，即大模型利用輸入的新數(shù)據(jù)，一次性獲得正確結(jié)論的過(guò)程。除模型本身的設(shè)計(jì)外，還需要強(qiáng)大的硬件作為基礎(chǔ)。

在8月21日舉辦的2024火山引擎AI創(chuàng)新巡展上海站活動(dòng)上，火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人羅浩發(fā)表演講，介紹了火山引擎AI全棧云在算力升級(jí)、資源管理、性能和穩(wěn)定性等方面做出的努力，尤其是分享了針對(duì)大模型推理問(wèn)題的解決方案。

羅浩表示，在彈性方面，與傳統(tǒng)的云原生任務(wù)相比，推理任務(wù)，以及面向AI native應(yīng)用，由于其所對(duì)應(yīng)的底層資源池更加復(fù)雜，因此面臨的彈性問(wèn)題也更加復(fù)雜。傳統(tǒng)的在線任務(wù)彈性，主要存在于CPU、內(nèi)存、存儲(chǔ)等方面，而AI native應(yīng)用的彈性問(wèn)題，則涉及模型彈性、GPU彈性、緩存彈性，以及RAG、KV Cache等機(jī)制的彈性。

同時(shí)，由于底層支撐算力和包括數(shù)據(jù)庫(kù)系統(tǒng)在內(nèi)的存儲(chǔ)都發(fā)生了相應(yīng)的變化，也導(dǎo)致對(duì)應(yīng)的觀測(cè)體系和監(jiān)控體系出現(xiàn)不同的變化，帶來(lái)新的挑戰(zhàn)。

在具體應(yīng)對(duì)上，火山引擎首先在資源方面，面向不同的需求，提供了更多類型的多達(dá)幾百種計(jì)算實(shí)例，包括推理、訓(xùn)練以及不同規(guī)格推理和訓(xùn)練的實(shí)例類型，同時(shí)涵蓋CPU和GPU。

在選擇實(shí)例時(shí)，火山引擎應(yīng)用了自研的智能選型產(chǎn)品，當(dāng)面訓(xùn)練場(chǎng)景或推理場(chǎng)景時(shí)，在給定推理引擎，以及該推理引擎所對(duì)應(yīng)的模型時(shí)，都會(huì)給出更加適配的GPU或CPU實(shí)例。該工具也會(huì)自動(dòng)探索模型參數(shù)，包括推理引擎性能等，從而找到最佳匹配實(shí)例。

最后，結(jié)合整體資源調(diào)度體系，可以通過(guò)容器、虛擬機(jī)、Service等方式，滿足對(duì)資源的需求。

而在數(shù)據(jù)領(lǐng)域，目前在訓(xùn)練場(chǎng)景，最主要會(huì)通過(guò)TOS、CFS、VPFS支持大模型的訓(xùn)練和分發(fā)，可以看到所有的存儲(chǔ)、數(shù)據(jù)庫(kù)等都在逐漸轉(zhuǎn)向高維化，提供了對(duì)應(yīng)的存儲(chǔ)和檢索能力。

在數(shù)據(jù)安全方向，當(dāng)前的存儲(chǔ)數(shù)據(jù)，已經(jīng)有了更多內(nèi)容屬性，企業(yè)和用戶對(duì)于數(shù)據(jù)存儲(chǔ)的安全性也更加在意。對(duì)此，火山引擎在基礎(chǔ)架構(gòu)層面提供全面的路審計(jì)能力，可通過(guò)專區(qū)形式，支持從物理機(jī)到交換機(jī)，再到專屬云以及所有組件的對(duì)應(yīng)審計(jì)能力。

對(duì)此，羅浩以火山引擎與游戲公司沐瞳的具體合作為例給予了解釋。在對(duì)移動(dòng)端游戲里出現(xiàn)的語(yǔ)言、行為進(jìn)行審計(jì)和審核時(shí)，大量用到各種各樣的云基礎(chǔ)，以及包括大模型在內(nèi)的多種AI產(chǎn)品，而火山引擎做到了讓所有的產(chǎn)品使用都在同一朵云上，使其在整體調(diào)用過(guò)程當(dāng)中，不出現(xiàn)額外的流量成本，也使整體調(diào)用延時(shí)達(dá)到最優(yōu)化。

另外，在火山引擎與客戶“美圖”合作的案例中，在面對(duì)新年、元旦、情人節(jié)等流量高峰時(shí)，美圖通過(guò)火山引擎彈性的資源池，同時(shí)利用火山潮汐的算力，使得應(yīng)用整體使用GPU和CPU等云資源時(shí)，成本達(dá)到最優(yōu)化。

羅浩最后表示，未來(lái)火山引擎AI全棧云在算力、資源管理、性能及穩(wěn)定性等方面還將繼續(xù)探索，為AI應(yīng)用在各行業(yè)的落地，奠定更加堅(jiān)實(shí)的基礎(chǔ)，為推動(dòng)各行業(yè)智能化和數(shù)字化轉(zhuǎn)型的全新助力。

本文轉(zhuǎn)載自：，不代表科技訊之立場(chǎng)。原文鏈接：http://zl.yisouyifa.com/html/240826/1746201813522038.html

陳晨管理團(tuán)隊(duì)

0 0

產(chǎn)經(jīng)

高溫帶動(dòng)京東風(fēng)扇品類熱銷山東、遼寧、吉林等地銷售同比增長(zhǎng)超300%

小暑節(jié)氣到來(lái)，全國(guó)高溫天氣愈發(fā)嚴(yán)重。其中，廣東地區(qū)體感溫度已達(dá)40℃、地面溫度更是超過(guò)60℃，高溫甚至讓中國(guó)最北的北極村漠河居民下單購(gòu)買空調(diào)，空調(diào)、風(fēng)扇等清涼家電的銷售迎來(lái)一波高峰…

陳晨
9小時(shí)前
產(chǎn)經(jīng)

隱私為先，安心體驗(yàn)：探索保障Galaxy AI個(gè)性化體驗(yàn)的安全技術(shù)

人工智能潛力無(wú)限，但要充分釋放其潛能，驅(qū)動(dòng)個(gè)性化體驗(yàn)，用戶數(shù)據(jù)輸入至關(guān)重要。只有讓AI充分理解用戶的使用偏好與日常習(xí)慣，才能讓移動(dòng)體驗(yàn)成為日常生活的自然延伸。 Galaxy AI憑…

陳晨
9小時(shí)前
產(chǎn)經(jīng)

BW2025狂歡盛典，技嘉AORUS展臺(tái)玩法終極揭秘

盛夏的次元壁即將破碎!2025年7月11日至13日,BW2025的鐘聲即將敲響!上海國(guó)家會(huì)展中心3H館3A08坐標(biāo),技嘉AORUS將以雷霆之勢(shì)破次元而來(lái)!二次元的朋友們,是時(shí)候點(diǎn)燃…

陳晨
11小時(shí)前
產(chǎn)經(jīng)

飛書(shū)發(fā)布知識(shí)問(wèn)答等多款A(yù)I產(chǎn)品讓企業(yè)擁有懂自己的“豆包”

7月9日，飛書(shū)發(fā)布了知識(shí)問(wèn)答、AI會(huì)議、Aily、飛書(shū)妙搭等多款A(yù)I新產(chǎn)品。這一系列產(chǎn)品的發(fā)布，讓AI更能在企業(yè)落地，滿足企業(yè)的日常運(yùn)營(yíng)需求，即讓企業(yè)擁有了一個(gè)懂自己的“豆包”。 …

陳晨
12小時(shí)前
產(chǎn)經(jīng)

從廚房陷阱到PM2.5歸零：火星人Q60重塑中式廚房未來(lái)

中式廚房里的甜蜜陷阱煎炒烹炸的煙火氣里，承載著中國(guó)人最深沉的情感記憶。母親翻炒青椒肉絲的噼啪聲，父親油炸年糕的濃郁香氣，這些刻入中國(guó)人基因的味覺(jué)符號(hào)，卻在現(xiàn)代醫(yī)學(xué)的顯微鏡下顯露出…

陳晨
12小時(shí)前
產(chǎn)經(jīng)

又開(kāi)行業(yè)先河！卡薩帝發(fā)布墅式奢護(hù)中心，一站式解決洗烘護(hù)養(yǎng)

　　在1%的頂奢人群眼中，衣著是至關(guān)重要的社交名片與社交態(tài)度。他們對(duì)極致體驗(yàn)的追求同樣延伸至高端衣物的洗護(hù)領(lǐng)域，如何讓高定西裝、真絲襯衫、羊毛大衣等珍貴面料居家就能實(shí)現(xiàn)洗烘護(hù)養(yǎng)，達(dá)…

若安丶
12小時(shí)前
“2025京東方投資者日”在滬舉辦資本戰(zhàn)略轉(zhuǎn)型開(kāi)啟價(jià)值創(chuàng)造新階段

2025年7月8日，京東方（A股：000725；B股：200725）在上海舉辦“屏之物聯(lián) 聚智共贏”2025 BOE Investor Day主題活動(dòng)，京東方董事長(zhǎng)陳炎順，京東方副…

陳晨
產(chǎn)經(jīng) 13小時(shí)前
產(chǎn)經(jīng)

三星Galaxy全球新品發(fā)布會(huì)開(kāi)幕倒計(jì)時(shí) 新品值得期待

繽紛7月，驚喜不斷。尤其是7月9日22:00即將到來(lái)的三星Galaxy全球新品發(fā)布會(huì)，更成為數(shù)碼愛(ài)好者與星粉們翹首以盼的大事件。除了萬(wàn)眾矚目的智能手機(jī)新品外，即將發(fā)布的三星Gala…

陳晨
13小時(shí)前
產(chǎn)經(jīng)

華證發(fā)布A股可選消費(fèi)ESG TOP20，家電業(yè)僅一家上榜，是誰(shuí)？

　　7月8日，華證指數(shù)發(fā)布了2025年A股上市公司各一級(jí)行業(yè)ESG績(jī)效TOP20，涵蓋工業(yè)、公共事業(yè)、可選消費(fèi)、金融等11個(gè)行業(yè)。其中，在2025年A股上市公司可選消費(fèi)行業(yè)ESG績(jī)…

若安丶
15小時(shí)前
產(chǎn)經(jīng)

喜臨門(mén)跨界腦機(jī)接口行業(yè)，重構(gòu)AI 陪伴睡眠新體驗(yàn)

　　在全球睡眠健康需求呈爆發(fā)式增長(zhǎng)的當(dāng)下，一場(chǎng)深度重塑睡眠體驗(yàn)的產(chǎn)業(yè)變革已然拉開(kāi)帷幕。近日，“AI喜臨門(mén) 強(qiáng)腦科技獨(dú)家戰(zhàn)略合作簽約暨新品發(fā)布會(huì)”于浙江紹興舉行，為全球睡眠科技發(fā)展注…

若安丶
15小時(shí)前
產(chǎn)經(jīng)

青島首家標(biāo)準(zhǔn)化家電回收分揀中心在海爾投入運(yùn)營(yíng)

　　7月7日，海爾循環(huán)產(chǎn)業(yè)家電回收分揀中心在青島正式啟用，這也是青島首家標(biāo)準(zhǔn)化家電回收分揀中心。據(jù)了解，該分揀中心前端拉通回收渠道、后端直連規(guī)范拆解廠，構(gòu)建起標(biāo)準(zhǔn)化、數(shù)據(jù)化的運(yùn)營(yíng)管…

科技探索者
18小時(shí)前
產(chǎn)經(jīng)

肖特《Solutions》雜志｜從”虛驚一場(chǎng)”到實(shí)時(shí)掌控，改寫(xiě)腦部醫(yī)療史的玻璃“黑科技”

摘要：玻璃作為唯一能同時(shí)滿足生物相容性、耐用性與微型化需求的材料，如何幫助腦積水患者重拾生活安全感，讓頭痛不再是“定時(shí)炸彈”？對(duì)普通人而言，突如其來(lái)的頭痛也許只需休息或止痛藥緩解…

陳晨
18小時(shí)前
產(chǎn)經(jīng)

效率與質(zhì)感并重，西安豐行攜手佳能電影機(jī)EOS C80開(kāi)啟精品短劇時(shí)代

2025年，中國(guó)微短劇行業(yè)邁入“精品時(shí)代”。從內(nèi)容體量到創(chuàng)作流程，豎屏短劇正向更強(qiáng)影像品質(zhì)與更專業(yè)化流程全面轉(zhuǎn)型。短劇行業(yè)開(kāi)始進(jìn)入“質(zhì)效并重”的拐點(diǎn)期。在這一轉(zhuǎn)變中，專業(yè)設(shè)備開(kāi)始扮…

陳晨
18小時(shí)前
產(chǎn)經(jīng)

TCL電子榮膺“ESG環(huán)境友好卓越企業(yè)”，引領(lǐng)綠色可持續(xù)發(fā)展浪潮

（2025年7月4日，香港）- TCL電子控股有限公司（“TCL電子”或“公司”，01070.HK）憑借在環(huán)境管理領(lǐng)域的系統(tǒng)性實(shí)踐與可量化成果，于格隆匯“全球投資嘉年華·…

陳晨
1天前
產(chǎn)經(jīng)

2025母嬰級(jí)除甲醛品牌推薦：6款強(qiáng)力分解甲醛產(chǎn)品測(cè)評(píng)

新房甲醛污染是一個(gè)實(shí)實(shí)在在的健康風(fēng)險(xiǎn)，其危害從輕微刺激到嚴(yán)重疾病乃至癌癥，影響廣泛。聯(lián)合國(guó)相關(guān)機(jī)構(gòu)，特別是世界衛(wèi)生組織及其下屬的IARC，通過(guò)科學(xué)研究和權(quán)威評(píng)估，明確指出了甲醛的危…

陳晨
1天前
產(chǎn)經(jīng)

在世俱杯，看海信100吋第一背后的再進(jìn)化

　　“在綠茵場(chǎng)上滾動(dòng)的不是足球，而是黃金。”時(shí)隔多年，足壇名宿貝肯鮑爾說(shuō)出的這番話，其含金量還在上升。而能夠證明這一點(diǎn)的無(wú)出其右，正是今年盛夏賺足眼球、熱錢(qián)涌動(dòng)的2025新世俱杯?！?/p>

科技探索者
1天前
小巧又全能佳能EOS R50盛夏人像體驗(yàn)

每年的盛夏都很難熬，室外酷暑又濕熱，讓人只想待在空調(diào)房里。但在攝影師眼中，盛夏是一年中最有生命力的時(shí)節(jié)，拍攝燦爛的夏花，捕捉忙碌的夏蟲(chóng)，而我更喜歡拍攝夏日富有生命力的人像。佳能E…

陳晨
產(chǎn)經(jīng) 1天前
產(chǎn)經(jīng)

三星Galaxy全球新品發(fā)布會(huì)7月9日上演：揭開(kāi)新一代折疊屏手機(jī)的面紗

隨著工藝和技術(shù)的不斷進(jìn)步，折疊屏手機(jī)已經(jīng)進(jìn)入成熟期，成為了廣大消費(fèi)者購(gòu)機(jī)的主要選項(xiàng)。三星作為在折疊屏領(lǐng)域探索多年的資深“玩家”，每次發(fā)布的折疊屏新品，都會(huì)引領(lǐng)行業(yè)新一輪的變革。7月…

陳晨
1天前
產(chǎn)經(jīng)

三星推出面向未來(lái)的移動(dòng)安全解決方案，賦能個(gè)性化AI體驗(yàn)

Knox增強(qiáng)加密保護(hù)（KEEP）、具備抗量子加密能力的安全Wi-Fi等多項(xiàng)創(chuàng)新功能，為新一代Galaxy智能手機(jī)帶來(lái)更強(qiáng)大、更可控的隱私防護(hù)能力 2025年7月7日，三星電子今日宣…

陳晨
1天前
產(chǎn)經(jīng)

技嘉科技 STEALTH Revolution 玩轉(zhuǎn)簡(jiǎn)約裝機(jī)美學(xué) 力邀創(chuàng)作者打造純白夢(mèng)幻桌機(jī)

電腦品牌技嘉科技 STEALTH Revolution 活動(dòng)正式開(kāi)跑,以旗下 STEALTH ICE 系列電腦零組件,引領(lǐng)”背插主板 × 純白機(jī)身”裝機(jī)新潮…

陳晨
1天前

發(fā)表回復(fù)

登錄后才能評(píng)論

一文揭秘：火山引擎云基礎(chǔ)設(shè)施如何支撐大模型應(yīng)用落地

相關(guān)推薦

發(fā)表回復(fù)