GPUStack正式發(fā)布: 為大模型而生的開源GPU集群管理器

陳晨 ? 2024年7月29日 09:47:29 ? 產(chǎn)經(jīng)

7月26日，數(shù)澈軟件Seal（以下簡稱“Seal”）宣布正式發(fā)布并開源最新產(chǎn)品 GPUStack，GPUStack 是一個用于運行 LLM（大型語言模型）的開源 GPU 集群管理器。

盡管如今大語言模型作為公共的云上服務已經(jīng)被廣泛推廣并在公有云上變得更加易于使用，但對企業(yè)來說，部署托管自己私有的 LLM 供企業(yè)和組織在私有環(huán)境使用仍然非常復雜。

首先，企業(yè)需要安裝和管理復雜的集群軟件，如 Kubernetes，然后還需要研究清楚如何在上層安裝和管理 AI 相關的工具棧。而目前流行的能在本地環(huán)境運行 LLM 的方法，如 LMStudio 和 LocalAI，卻大都只支持在單臺機器上運行，而沒有提供多節(jié)點復雜集群環(huán)境的支持能力。

Seal 聯(lián)合創(chuàng)始人及 CTO 梁勝博士介紹道，“GPUStack 支持基于任何品牌的異構 GPU 構建統(tǒng)一管理的算力集群，無論目標 GPU 運行在 Apple Mac、Windows PC 還是 Linux 服務器上， GPUStack 都能統(tǒng)一納管并形成統(tǒng)一算力集群。GPUStack 管理員可以從諸如 Hugging Face 等流行的大語言模型倉庫中輕松部署任意 LLM。進而，開發(fā)人員則可以像訪問 OpenAI 或 Microsoft Azure 等供應商提供的公有 LLM 服務的 API 一樣，非常簡便地調用 OpenAI 兼容的 API 訪問部署就緒的私有 LLM?！?/p>

幫助企業(yè)簡單快速地開啟 LLM 創(chuàng)新

當前，企業(yè)如果想要在 GPU 集群上托管大模型，必須要做大量的工作來集成復雜的技術棧。通過使用 GPUStack，企業(yè)不再需要擔心如何管理 GPU 集群、推理引擎和推理加速、租戶和配額管理、使用和計量、性能度量、統(tǒng)一認證授權和訪問控制，以及儀表板。

如下圖所示，GPUStack 是一個構建企業(yè)私有的大模型即服務（LLMaaS）的完整平臺，擁有構建大模型即服務所需的各項功能。管理員可以將模型從 Hugging Face 等模型倉庫部署到 GPUStack 中，然后開發(fā)人員可以連接到 GPUStack 提供的私有大模型 API，在他們的應用中集成和使用私有大模型服務。

“隨著大語言模型能力的逐漸提高，企業(yè)和組織一方面對快速進入 AI 時代充滿了信心并滿懷期待，希望大語言模型能盡快為自己的企業(yè)和組織帶來生產(chǎn)效能的提高，而另一方面，對于能否有效地把如火如荼的大語言模型技術進一步與實際業(yè)務進行有機結合，是否能因此產(chǎn)生相應的效益，企業(yè)及團隊又同時充滿了疑問。我們希望通過簡單易用的 GPUStack 平臺，部署和運行各種開源大語言模型，提供 OpenAI 兼容的 API 接口，使得開發(fā)人員簡單方便地訪問任何的 LLM?！?nbsp;Seal 聯(lián)合創(chuàng)始人及 CEO 秦小康介紹道，“最重要的是，我們支持 Nvidia，Intel，AMD 及眾多品牌的 GPU，在支持異構 GPU 集群的同時能為企業(yè)節(jié)省更多成本。幫助企業(yè)簡單快速地開啟 LLM 創(chuàng)新是 GPUStack 團隊的初心和使命?！?/p>

整合GPU資源運行大模型

組建 GPU 集群整合資源

GPUStack 可以聚合集群內的所有 GPU 資源。它旨在支持所有的 GPU 廠商，包括英偉達，蘋果，AMD，英特爾，高通，華為等。GPUStack 兼容運行 MacOS、Windows 和 Linux 操作系統(tǒng)的筆記本電腦、臺式機、工作站和服務器。

模型部署和推理

GPUStack 為在不同 GPU 上部署不同大模型選擇最佳的推理引擎，支持的首個推理引擎是 LLaMA.cpp，其他推理引擎（如vLLM）的支持也在路線圖中。

在資源充足的情況下，GPUStack 默認將模型全部卸載到 GPU，以實現(xiàn)最佳性能的推理加速。如果 GPU 資源相對不足，GPUStack 會同時使用 GPU 和 CPU 進行混合推理，以最大限度地利用資源。而在沒有 GPU 資源的場景下，GPUStack 也支持純 CPU 推理。這樣的設計使 GPUStack 能夠更廣泛地適配各種邊緣或資源有限的環(huán)境。

快速與現(xiàn)有應用集成

GPUStack 提供了與 OpenAI 兼容的 API，并提供了大模型試驗場。開發(fā)人員可以調試大模型并將其快速集成到自己的應用中。此外，開發(fā)人員還可以通過觀測指標來了解應用對各種大模型的使用情況。這也有助于管理員有效地管理 GPU 資源利用。

GPU 和 LLM 的觀測指標

GPUStack 提供全面的性能、利用率和狀態(tài)監(jiān)控指標。對于 GPU，管理員可以使用 GPUStack 實時監(jiān)控資源利用率和系統(tǒng)狀態(tài)。對于 LLM，相關指標則可以幫助開發(fā)人員評估模型的性能并優(yōu)化應用。

認證和訪問控制

GPUStack 為企業(yè)提供身份驗證和RBAC（Role-based Access Control）功能。這保證了只有授權的管理員可以部署和管理大模型，只有授權的開發(fā)人員可以使用大模型，應用也可以通過統(tǒng)一的 API 認證授權訪問各種大模型。

加入社區(qū)，參與開源共創(chuàng)

GPUStack 項目正在快速迭代，計劃引入對多模態(tài)模型的支持，更多的 GPU 廠商支持，以及更多的推理引擎支持。我們十分歡迎您一起參與開源項目的貢獻，也歡迎在我們的 GitHub 倉庫 gpustack/gpustack 上點亮 Star 關注我們的最新動態(tài)。

本文轉載自：，不代表科技訊之立場。原文鏈接：http://articlef.yulepops.com/article/m-165/1/412202407290742474581887.html

陳晨管理團隊

0 0

產(chǎn)經(jīng)

5G-R 技術邁上新臺階！泰通科技專利布局筑牢發(fā)展根基?

第十七屆中國國際現(xiàn)代化鐵路技術裝備展覽會揭幕，國產(chǎn)化 5G-R 系統(tǒng)首次實物展示引矚目，中國鐵路通信技術邁入自主創(chuàng)新新時代 7月8日到10日，被譽為鐵路行業(yè)”奧林匹克…

陳晨
32分鐘前
產(chǎn)經(jīng)

三星旗艦機型上新！現(xiàn)在就能用上的AI手機

7月9日，三星 Galaxy 全球新品發(fā)布會正式推出最新Z系列產(chǎn)品 Galaxy Z Fold7、Z Flip7、Z Flip7 FE。 Galaxy Z Fold7是…

陳晨
33分鐘前
便攜設計強悍功能三星Galaxy新品攜創(chuàng)新成果齊亮相

7月9日，新一代三星折疊屏手機三星Galaxy Z Fold7與Galaxy Z Flip7，以及三星Galaxy智能手表新品正式發(fā)布。三星借助精湛工藝與前沿技術，并結合產(chǎn)品的獨特…

陳晨
產(chǎn)經(jīng) 33分鐘前
產(chǎn)經(jīng)

折疊屏的終極形態(tài)！三星Galaxy Z Fold7帶來Ultra級性能體驗

北京時間2025年7月9日，三星Galaxy全球新品發(fā)布會如期而至，正式揭開了新一代折疊屏旗艦——三星Galaxy Z Fold7的神秘面紗。其不僅是三星迄今為止最纖薄、最輕巧的折…

陳晨
34分鐘前
產(chǎn)經(jīng)

超大屏更懂你三星Galaxy Z Fold7帶來智能AI新體驗

從去年開始，經(jīng)過近一年的時間考驗與口碑積累，三星Galaxy Z Fold6的市場表現(xiàn)相當亮眼，“大屏+AI”的折疊屏體驗也廣受歡迎。如今，新一代三星Galaxy Z Fold7以…

陳晨
35分鐘前
產(chǎn)經(jīng)

熱瘋了！這個品牌卻要發(fā)布“無風口空調”？

　　最近，你也在為氣溫發(fā)愁嗎？家里比室外還熱，一天24小時開空調，皮膚干、肩膀疼，空調病沒跑了……三伏天快到了，大家經(jīng)常抱怨的話題就是“不開空調要命，開空調得病”。所以，能不能只留…

潮玩君
15小時前
產(chǎn)經(jīng)

科技賦能解鎖自律新體驗快來參與三星Galaxy Watch8系列預約！

要想實現(xiàn)健康的生活方式其實很簡單，保持規(guī)律的生活節(jié)奏和健康的飲食習慣，就能輕松達成目標。這也是智能手表越來越盛行的原因之一。在科技手段的幫助下，管理健康生活將變得更加簡易方便。尤其…

陳晨
16小時前
產(chǎn)經(jīng)

三星二季度利潤暴跌56%，半導體產(chǎn)業(yè)輪動或進入“中國時間”

7月8日，三星電子發(fā)布公告稱，預計二季度營業(yè)利潤為4.6萬億韓元，同比暴跌56%，環(huán)比下跌31.24%，創(chuàng)6個季度以來最低水平，大幅低于市場預期。受此影響，三星電子股價連續(xù)3個交易…

陳晨
18小時前
產(chǎn)經(jīng)

央視探訪海信空調實驗室，揭秘賽場外的黑科技

2025世俱杯激戰(zhàn)正酣，全球球迷在聚焦綠茵場上巔峰對決的同時，對觀賽環(huán)境的舒適度也有了更高要求。近日，央視財經(jīng)《超級生產(chǎn)線》欄目組走進海信研發(fā)中心，為全球球迷揭秘世俱…

陳晨
18小時前
產(chǎn)經(jīng)

超級旗艦纖薄新姿第七代Galaxy Z系列折疊屏開啟預約

2025年7月9日，三星正式發(fā)布了第七代折疊屏旗艦機型Galaxy Z Fold7與Galaxy Z Flip7，以及Galaxy Z Flip7 FE。三款新品以“AI賦能折疊形…

陳晨
18小時前
產(chǎn)經(jīng)

“曉妙”產(chǎn)業(yè)大模型——AI驅動的產(chǎn)業(yè)變革

7月4日，在長城工程科技會議上，由傲林科技有限公司投資，技術支持的安徽數(shù)智建材研究院有限公司（以下簡稱：數(shù)智建材研究院），圍繞創(chuàng)新研發(fā)的“曉秒”產(chǎn)業(yè)大模型進行了主旨報告分享。本次會…

陳晨
18小時前
產(chǎn)經(jīng)

2025中國芯片集體沖刺IPO：存儲龍頭長鑫科技或成“新標桿”

A股市場正掀起年內最大規(guī)模的半導體IPO熱潮。近期，已有至少11家半導體產(chǎn)業(yè)鏈企業(yè)向交易所遞交上市申請，涵蓋從材料、封測到高性能計算芯片等多個關鍵環(huán)節(jié)，凸顯出國內半導體產(chǎn)業(yè)加速資本…

陳晨
19小時前
產(chǎn)經(jīng)

花王集團旗下品牌“Curél珂潤”亮相2025中華醫(yī)學會 ——布局中國紅荒肌市場，解鎖干敏肌護膚方案

2025年6月27日至29日,在長沙國際會議中心隆重舉行的中華醫(yī)學會第三十次皮膚性病學術年會(CSD2025)上,專注干燥性敏感皮膚護理的“Curél珂潤品牌”攜包含進階版※神經(jīng)?！?/p>

陳晨
19小時前
產(chǎn)經(jīng)

半年評級“買入”最多！機構到底看好海爾智家什么？

　　2025上半年已悄然落幕，家電行業(yè)的機構評級成績單正式揭曉。在競爭激烈的市場中，哪家企業(yè)評級“買入”最多？　　從Wind數(shù)據(jù)看，海爾智家以25家“買入”評級，位居家電行業(yè)榜首…

若安丶
21小時前
產(chǎn)經(jīng)

從技術迷霧到安全落地，智能輔助駕駛白皮書引領行業(yè)理性回歸

在智能輔助駕駛技術飛速發(fā)展的今天，汽車行業(yè)正站在一個關鍵的十字路口。一方面，技術革新帶來了前所未有的駕駛體驗；另一方面，安全與倫理的挑戰(zhàn)也日益凸顯。7月8日，中汽中心、清華大學與華…

陳晨
23小時前
Check Point：人工智能正反博弈，企業(yè)應更加主動應對挑戰(zhàn)

在網(wǎng)絡安全領域，人工智能（AI）一直被視為防御的一大利器，其帶來的速度、準確性與自動化能力正在徹底改變企業(yè)的防護方式。但是，網(wǎng)絡安全從業(yè)人員必須要關注技術發(fā)展的“陰暗面”：網(wǎng)絡犯罪…

陳晨
產(chǎn)經(jīng) 23小時前
產(chǎn)經(jīng)

放肆運動無懼汗水三星AI神系列洗護產(chǎn)品即刻煥新夏日穿搭

對于運動達人和戶外愛好者而言，每逢盛夏最困擾的莫過于衣物高頻換洗帶來的家務壓力，從洗滌到晾曬既繁瑣又耗時，遇上陰雨天氣更會打亂次日的健身計劃。三星AI神黑鉆熱泵洗烘旗艦與AI神 …

陳晨
23小時前
產(chǎn)經(jīng)

三星專家認證服務 Samsung Care+守護三星Galaxy Z Fold7|Z Flip7

隨著智能手機的不斷進化,用戶對服務的關注也正悄然升級。特別是對于折疊屏這類高端旗艦機型而言,用戶更希望能夠通過更豐富的保障服務,讓日常使用更加安心。對此,三星專為旗下Galaxy設…

陳晨
1天前
產(chǎn)經(jīng)

兼顧睡眠與鍛煉三星Galaxy Watch8系列定義舒適佩戴新體驗

2025年7月9日,三星電子宣布推出三星Galaxy Watch8和三星Galaxy Watch8 Classic,將標志性設計語言統(tǒng)一至整個三星Galaxy Watch產(chǎn)品陣容?！?/p>

陳晨
1天前
產(chǎn)經(jīng)

入駐各大高校！美的空調以硬核實力領跑暑假清涼保衛(wèi)戰(zhàn)

2025年6月開始，我國氣溫突破歷史同期極值，首個高溫日（6月17日）對比2024年提前約兩周出現(xiàn)。在“熱穹頂”效應和全球變暖的共同作用下，北半球普遍出現(xiàn)異常高溫現(xiàn)象，酷熱難耐也成…

陳晨
1天前

發(fā)表回復

登錄后才能評論

GPUStack正式發(fā)布: 為大模型而生的開源GPU集群管理器

相關推薦

發(fā)表回復