騰訊混元推出自研深度思考模型T1正式版

騰訊混元推出自研深度思考模型T1正式版

今日,騰訊混元在其官方微信公眾號上宣布,自研深度思考模型T1正式版正式上線。這款模型以吐字迅速、秒級響應(yīng)和超長文本處理能力為特色,是騰訊在強(qiáng)推理模型領(lǐng)域的又一力作。

據(jù)官方介紹,T1通過大規(guī)模強(qiáng)化學(xué)習(xí),并結(jié)合數(shù)學(xué)、邏輯推理、科學(xué)和代碼等理科難題的專項(xiàng)優(yōu)化,進(jìn)一步提升了推理能力。在多項(xiàng)基準(zhǔn)測試中,如MMLU-PRO、CEval、AIME和Zebra Logic等,T1均取得了業(yè)界領(lǐng)先的成績。

T1沿用了混元Turbo S的創(chuàng)新架構(gòu),首次在工業(yè)界將混合Mamba架構(gòu)無損應(yīng)用于超大型推理模型,有效降低了計算復(fù)雜度和內(nèi)存占用,顯著降低了訓(xùn)練和推理成本。同時,針對長序列處理進(jìn)行了專項(xiàng)優(yōu)化,確保長文本信息捕捉能力的同時大幅降低資源消耗,解碼速度提升2倍。

此外,T1在多項(xiàng)對齊任務(wù)、指令跟隨任務(wù)和工具利用任務(wù)中也展現(xiàn)出非常強(qiáng)的適應(yīng)性。目前,T1已在騰訊云官網(wǎng)上線,提供API接口服務(wù),輸入價格為每百萬tokens 1元,輸出價格為每百萬tokens 4元。用戶可通過訪問騰訊混元T1官網(wǎng)進(jìn)行體驗(yàn)和使用。

此次T1的推出,標(biāo)志著騰訊在AI推理模型領(lǐng)域取得了新的突破,為行業(yè)提供了更加高效、智能的解決方案。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/711718.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論