谷歌Gemini 2.5全家桶上線:Flash穩(wěn)定、Flash-Lite刷新性價(jià)比紀(jì)錄

谷歌Gemini 2.5全家桶上線:Flash穩(wěn)定、Flash-Lite刷新性價(jià)比紀(jì)錄

谷歌公司今日(6月18日)宣布Gemini 2.5系列AI模型重大進(jìn)展:Gemini 2.5 ProGemini 2.5 Flash結(jié)束預(yù)覽階段,正式進(jìn)入穩(wěn)定運(yùn)行狀態(tài),標(biāo)志著兩款模型已通過企業(yè)級(jí)壓力測(cè)試,可支持生產(chǎn)環(huán)境部署。與此同時(shí),全新輕量級(jí)模型?Gemini 2.5 Flash-Lite?首次亮相預(yù)覽版,成為谷歌當(dāng)前推理速度最快、成本效益最高的AI引擎。

此次升級(jí)的核心在于重構(gòu)”成本-速度-性能”三角平衡。穩(wěn)定版Gemini 2.5 Flash與Pro已獲Spline、Rooms等創(chuàng)新企業(yè),以及Snap、SmartBear等科技公司投入實(shí)際應(yīng)用開發(fā)。而新推出的Flash-Lite在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)亮眼:其代碼編寫、科學(xué)計(jì)算及多模態(tài)分析能力全面超越前代2.0 Flash-Lite,翻譯與分類任務(wù)的延遲顯著降低,尤其適配需要瞬時(shí)響應(yīng)的場(chǎng)景。

更值得關(guān)注的是成本控制——Flash-Lite在未啟用”動(dòng)態(tài)思考”模式時(shí),輸入token成本低至?每百萬0.1美元?(約人民幣0.72元),輸出成本為每百萬0.4美元,相較同類模型具備顯著價(jià)格優(yōu)勢(shì)。該模型繼承了2.5系列的核心能力,包括百萬級(jí)token上下文處理、外部工具鏈對(duì)接(如谷歌搜索與代碼執(zhí)行器),并提供推理預(yù)算靈活調(diào)控接口。

開發(fā)者可通過Google AI Studio與Vertex AI平臺(tái)獲取2.5 Flash/Pro穩(wěn)定版及Flash-Lite預(yù)覽版。消費(fèi)端Gemini應(yīng)用已集成2.5 Flash和Pro模型,而谷歌搜索引擎則部署了定制優(yōu)化的Flash-Lite與Flash版本,以提升實(shí)時(shí)檢索效率。此次全線升級(jí),標(biāo)志著谷歌在高效能AI商業(yè)化賽道邁出關(guān)鍵一步。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.2079x.cn/article/724400.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論