谷歌上線“省錢版”AI模型,Gemini 2.5 Flash主攻實時場景

谷歌上線“省錢版”AI模型,Gemini 2.5 Flash主攻實時場景

今日,谷歌正式推出全新AI模型Gemini 2.5 Flash,定位為“高性價比推理工具”,主打低成本實時響應能力。該模型即日起開放測試,并將率先登陸谷歌AI開發(fā)平臺Vertex AI。?
谷歌在技術博客中介紹,Gemini 2.5 Flash支持動態(tài)調節(jié)算力,開發(fā)者可根據任務復雜度靈活分配處理時間。例如處理簡單客服咨詢時,系統(tǒng)自動縮短響應耗時以降低計費成本;面對復雜文檔解析則延長計算精度。谷歌稱該特性可將綜合成本壓縮至旗艦模型Gemini 2.5 Pro的50%,適用于需高頻調用AI的銀行、電信等行業(yè)。?
與OpenAI的o3-mini、深度求索的R1類似,Gemini 2.5 Flash被歸類為“推理優(yōu)化模型”,在回答前需執(zhí)行事實校驗,響應時間較生成式模型略長。但其平均延遲控制在0.8秒內,適配智能客服、會議紀要生成等實時場景。谷歌特別提到,該模型已應用于內部郵件摘要工具,單日處理量超200萬條。?
谷歌同步宣布,自2024年第三季度起,企業(yè)可通過谷歌分布式云(GDC)在自有服務器部署Gemini系列模型。目前正與英偉達合作適配Blackwell架構硬件,客戶可通過谷歌或合作渠道采購搭載該芯片的本地算力設備,滿足金融、醫(yī)療等敏感數據行業(yè)的合規(guī)需求。?
值得注意的是,谷歌未披露Gemini 2.5 Flash的技術白皮書及安全測試結果。公司解釋稱,對于定義為“實驗性”的模型暫不發(fā)布詳細報告,但承諾已通過內部倫理審查。此前Gemini 1.5 Pro因圖像生成偏差引發(fā)爭議,此次策略調整引發(fā)開發(fā)者社區(qū)對模型透明度的討論。

據Vertex AI后臺數據顯示,Gemini 2.5 Flash開放測試3小時內,已有超過1.2萬家企業(yè)申請接入,其中63%來自客戶服務、文檔管理領域。谷歌計劃在9月前完成首批企業(yè)用戶的模型部署。

原創(chuàng)文章,作者:Google,如若轉載,請注明出處:http://m.2079x.cn/article/714290.html

Google的頭像Google認證作者

相關推薦

發(fā)表回復

登錄后才能評論