字節(jié)跳動豆包上線「深度思考」推理模式,覆蓋問答、搜索、寫作和閱讀場景

字節(jié)跳動旗下 AI 助手豆包正在小范圍測試深度思考模型,已上線「深度思考」推理模式,全面覆蓋問答、搜索、寫作和閱讀場景。深度思考模式可以讓用戶直觀看到模型的思考過程,理解模型解決問題的邏輯鏈條。

3 月 6 日消息,上周二有網(wǎng)友發(fā)現(xiàn),字節(jié)跳動旗下 AI 助手豆包正在小范圍測試深度思考模型,但接入的不是 DeepSeek 模型。

字節(jié)跳動豆包上線「深度思考」推理模式,覆蓋問答、搜索、寫作和閱讀場景

2025 年 3 月 5 日,豆包宣布上線「深度思考」推理模式,全面覆蓋問答、搜索、寫作和閱讀場景。要想進(jìn)入「深度思考」推理模式,用戶只需在輸入框打開「深度思考 Beta」開關(guān)即可。

上周測試時,豆包相關(guān)負(fù)責(zé)人回應(yīng)表示,當(dāng)前測試的是自家深度思考模型的不同實驗版本。還有消息稱,豆包正在測試的深度思考模型是基于豆包 1.5 基座模型研發(fā)。

查詢發(fā)現(xiàn),此前在 1 月中旬,豆包大模型團隊在發(fā)布豆包 1.5 Pro 時就宣布了深度推理模型 Doubao-1.5-pro-AS1-Preview 的存在,并稱其“在完全不使用其他模型數(shù)據(jù)的條件下,通過 RL 算法的突破和工程優(yōu)化,充分發(fā)揮 Test Time Scaling 的算力優(yōu)勢,完成了 RL Scaling,研發(fā)了 Doubao 深度思考模式”。

簡單來說,深度思考模式可以讓用戶直觀看到模型的思考過程,這中間涉及思維鏈的展示,也就是 COT(Chain of Thought)—— 思維鏈?zhǔn)悄M出來的,通過訓(xùn)練讓模型輸出中間步驟,比如自我質(zhì)疑和反思,雖然只是文字序列,但看起來像人類的思考過程。

在深度思考模式下,用戶不僅能看到 AI 的最終答案,還能觀察到模型解決問題的完整邏輯鏈條,包括自我質(zhì)疑、假設(shè)驗證、錯誤修正等步驟。比如,在解決數(shù)學(xué)題時,模型會展示其從問題拆解、多方法驗證到最終結(jié)論的全過程。

原創(chuàng)文章,作者:潮玩君,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/709056.html

潮玩君的頭像潮玩君管理團隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論