?字節(jié)跳動豆包1.5模型發(fā)布:看圖思考、視頻找答案全能升級

?字節(jié)跳動豆包1.5模型發(fā)布:看圖思考、視頻找答案全能升級

在近日的火山引擎AI創(chuàng)新巡展杭州站上,字節(jié)跳動旗下火山引擎總裁譚待正式發(fā)布豆包1.5深度思考模型。這款多模態(tài)大模型在數(shù)學(xué)推理、編程競賽、科學(xué)分析等專業(yè)領(lǐng)域表現(xiàn)突出,其數(shù)學(xué)能力追平OpenAI o3-mini-high,編程與科學(xué)測試成績接近o1模型水平,創(chuàng)意寫作與人文知識問答同樣展現(xiàn)廣泛適用性。

技術(shù)細(xì)節(jié)顯示,豆包1.5采用MoE混合專家架構(gòu),總參數(shù)達(dá)2000億,激活參數(shù)僅200億,較同類模型減少50%計(jì)算資源消耗。其API服務(wù)響應(yīng)延遲低至20毫秒,支持每秒數(shù)萬次高并發(fā)調(diào)用,顯著降低企業(yè)使用成本。更引人注目的是,該模型整合視覺理解技術(shù),能通過照片分析地質(zhì)構(gòu)造,旅行時實(shí)時翻譯菜單并推薦菜品,甚至輔助企業(yè)繪制項(xiàng)目管理流程圖。

同步開放的文生圖模型Seedream3.0已登陸即夢AI與豆包平臺,支持2K高清圖像直出,在權(quán)威評測平臺Artificial Analysis中躋身第一梯隊(duì)。該模型在構(gòu)圖精準(zhǔn)度、文字排版、畫面真實(shí)感等方面表現(xiàn)優(yōu)異,企業(yè)用戶可即刻調(diào)用其創(chuàng)作能力。

視頻搜索功能升級成為另一亮點(diǎn)。豆包1.5可精準(zhǔn)定位視頻片段,根據(jù)用戶問題提取對應(yīng)畫面與語音信息,例如在科普視頻中快速檢索實(shí)驗(yàn)步驟。

譚待同時披露,豆包大模型生態(tài)發(fā)展迅猛。截至2025年3月,其日均Tokens處理量突破12.7萬億,較初期暴增106倍,覆蓋辦公、教育、娛樂等多元場景。目前,火山引擎已向企業(yè)開放豆包系列模型API接口,開發(fā)者可通過火山方舟平臺接入測試。

此次升級標(biāo)志著字節(jié)跳動在通用AI領(lǐng)域邁出關(guān)鍵一步。隨著多模態(tài)技術(shù)持續(xù)突破,豆包模型正加速滲透至產(chǎn)業(yè)應(yīng)用端,為智能服務(wù)提供更強(qiáng)大的底層支撐。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/715297.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論