谷歌上線“省錢版”AI模型,Gemini 2.5 Flash主攻實時場景

谷歌上線“省錢版”AI模型,Gemini 2.5 Flash主攻實時場景

今日,谷歌正式推出全新AI模型Gemini 2.5 Flash,定位為“高性價比推理工具”,主打低成本實時響應(yīng)能力。該模型即日起開放測試,并將率先登陸谷歌AI開發(fā)平臺Vertex AI。?
谷歌在技術(shù)博客中介紹,Gemini 2.5 Flash支持動態(tài)調(diào)節(jié)算力,開發(fā)者可根據(jù)任務(wù)復(fù)雜度靈活分配處理時間。例如處理簡單客服咨詢時,系統(tǒng)自動縮短響應(yīng)耗時以降低計費成本;面對復(fù)雜文檔解析則延長計算精度。谷歌稱該特性可將綜合成本壓縮至旗艦?zāi)P虶emini 2.5 Pro的50%,適用于需高頻調(diào)用AI的銀行、電信等行業(yè)。?
與OpenAI的o3-mini、深度求索的R1類似,Gemini 2.5 Flash被歸類為“推理優(yōu)化模型”,在回答前需執(zhí)行事實校驗,響應(yīng)時間較生成式模型略長。但其平均延遲控制在0.8秒內(nèi),適配智能客服、會議紀(jì)要生成等實時場景。谷歌特別提到,該模型已應(yīng)用于內(nèi)部郵件摘要工具,單日處理量超200萬條。?
谷歌同步宣布,自2024年第三季度起,企業(yè)可通過谷歌分布式云(GDC)在自有服務(wù)器部署Gemini系列模型。目前正與英偉達(dá)合作適配Blackwell架構(gòu)硬件,客戶可通過谷歌或合作渠道采購搭載該芯片的本地算力設(shè)備,滿足金融、醫(yī)療等敏感數(shù)據(jù)行業(yè)的合規(guī)需求。?
值得注意的是,谷歌未披露Gemini 2.5 Flash的技術(shù)白皮書及安全測試結(jié)果。公司解釋稱,對于定義為“實驗性”的模型暫不發(fā)布詳細(xì)報告,但承諾已通過內(nèi)部倫理審查。此前Gemini 1.5 Pro因圖像生成偏差引發(fā)爭議,此次策略調(diào)整引發(fā)開發(fā)者社區(qū)對模型透明度的討論。

據(jù)Vertex AI后臺數(shù)據(jù)顯示,Gemini 2.5 Flash開放測試3小時內(nèi),已有超過1.2萬家企業(yè)申請接入,其中63%來自客戶服務(wù)、文檔管理領(lǐng)域。谷歌計劃在9月前完成首批企業(yè)用戶的模型部署。

原創(chuàng)文章,作者:Google,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/714290.html

Google的頭像Google認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論