Mistral推出Medium 3模型:性能對(duì)標(biāo)Claude,成本直降60%

Mistral推出Medium 3模型:性能對(duì)標(biāo)Claude,成本直降60%

當(dāng)?shù)貢r(shí)間5月7日,歐洲AI公司Mistral正式發(fā)布?Mistral Medium 3?大語言模型,主打“高性能+低成本”雙重優(yōu)勢(shì)。官方宣稱,這一中等量級(jí)模型在編程、STEM(科學(xué)/技術(shù)/工程/數(shù)學(xué))及多模態(tài)理解等專業(yè)領(lǐng)域表現(xiàn)突出,企業(yè)級(jí)功能適配成本顯著降低。?
Mistral Medium 3在基準(zhǔn)測(cè)試中表現(xiàn)達(dá)到或超過?Claude Sonnet 3.7?的90%,而成本僅為每百萬Token輸入0.4美元、輸出2美元,較Claude輸入1美元/輸出5美元的定價(jià)成本下降最高60%。同時(shí),其性能超越?Llama 4 Maverick?、?Cohere Command A?等開放與企業(yè)級(jí)模型,API調(diào)用成本也低于?DeepSeek v3。?
該模型支持?持續(xù)預(yù)訓(xùn)練?與?全參數(shù)微調(diào)?,可無縫集成企業(yè)私有知識(shí)庫。官方強(qiáng)調(diào),企業(yè)客戶可通過可視化界面完成模型部署,硬件資源消耗較上一代降低30%。此外,其多模態(tài)接口支持圖像、代碼與結(jié)構(gòu)化數(shù)據(jù)的聯(lián)合處理。

?技術(shù)亮點(diǎn)?

  • ?編程優(yōu)化?:內(nèi)置20+編程語言調(diào)試工具,代碼生成準(zhǔn)確率提升至92%
  • ?長(zhǎng)文本處理?:?jiǎn)未紊舷挛拇翱跀U(kuò)展至128K Token,支持超長(zhǎng)技術(shù)文檔解析
  • ?實(shí)時(shí)學(xué)習(xí)?:每小時(shí)可完成TB級(jí)數(shù)據(jù)增量訓(xùn)練,支持動(dòng)態(tài)行業(yè)知識(shí)更新

據(jù)報(bào)道,Mistral在發(fā)布公告中預(yù)告將推出?Medium 3?系列的升級(jí)版本?Large?,參數(shù)規(guī)模與多任務(wù)能力將進(jìn)一步擴(kuò)大。當(dāng)前Medium 3已開放云端API接入及本地化部署方案,企業(yè)用戶可申請(qǐng)30天免費(fèi)試用,包含1000萬Token額度。?
Mistral聯(lián)合創(chuàng)始人透露,新模型已通過歐盟GDPR合規(guī)認(rèn)證,并與AWS、谷歌云達(dá)成托管合作。第三方測(cè)試顯示,其API響應(yīng)速度較?GPT-4 Turbo?快17%,錯(cuò)誤率降低23%。截至發(fā)稿,Anthropic、Cohere等競(jìng)品尚未對(duì)此次發(fā)布作出回應(yīng)。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.2079x.cn/article/718166.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論