月之暗面重返基模戰(zhàn)場:發(fā)布首個開源萬億模型,押注“模型即Agent”

近期,Kimi-K2-Base和Kimi-K2-Instruct兩個版本發(fā)布,并開源,性能優(yōu)異。Kimi-K2-Instruct在評測中表現(xiàn)優(yōu)秀,逼近領(lǐng)先閉源模型。

近日發(fā)布并同步開源的新模型包括兩個版本:基礎(chǔ)模型Kimi-K2-Base、更適合通用聊天和智能體任務的后訓練模型Kimi-K2-Instruct。在自主編程、工具調(diào)用和數(shù)學推理相關(guān)的能力評測中,Kimi K2均取得了較優(yōu)的表現(xiàn)。以SWE-bench Verified、AIME 2025等評測集為例,Kimi-K2-Instruct的得分超過了同為開源模型的DeepSeek-V3、阿里Qwen3,逼近甚至能夠反超OpenAI GPT-4.1、Anthropic Claude 4 Opus等領(lǐng)先閉源模型。

月之暗面重返基模戰(zhàn)場:發(fā)布首個開源萬億模型,押注“模型即Agent”

結(jié)合6月底開啟內(nèi)測的新Agent“Kimi-Researcher”不難看出,月之暗面的思路正轉(zhuǎn)向“模型即Agent”。模型自身就集成了自主決策和執(zhí)行任務的能力,能夠作為智能體解決復雜任務。

在官方釋出的用例中,用戶要求Kimi K2幫忙規(guī)劃參加Coldplay樂隊巡演的行程。該模型通過17次工具調(diào)用,涵蓋搜索、日歷、郵箱、航班、餐廳預訂等環(huán)節(jié),制定出一份完整的機酒與旅游規(guī)劃,并形成可視化報告。

智能體能力正在成為國內(nèi)外大模型廠商競相押注的進化方向。本周,馬斯克旗下的人工智能初創(chuàng)公司xAI發(fā)布新一代大模型Grok 4,包括單智能體、多智能體兩個版本,具備工具使用、實時搜索等功能。Anthropic在推出Claude 4系列模型時也強調(diào),在編程、推理和Agent方面“樹立了全新標準”,能夠處理復雜且長時間運行的任務。

月之暗面在Kimi K2的技術(shù)博客里分享了對構(gòu)建開放智能體智能的看法。其指出,預訓練是智能體智能的關(guān)鍵基礎(chǔ),它讓模型擁有基本的知識、理解和推理能力,從而在后續(xù)的強化學習中更有效地學習。但“人類數(shù)據(jù)就像是有限的‘化石燃料’”,因此如何在預訓練階段提升對有限數(shù)據(jù)的利用效率,成為當前AI擴展的關(guān)鍵挑戰(zhàn)。

而在后訓練階段,大模型不再只依賴人類數(shù)據(jù),開始從自己的行為和結(jié)果中獲得獎勵、進行自我優(yōu)化,以實現(xiàn)超越人類能力的可能。

“Kimi K2正是在這些洞見之上鍛造而成的?!痹轮得姹硎?。其同時強調(diào),Kimi K2是構(gòu)建通用Agent能力的堅實基礎(chǔ),但通用Agent還需要更高級的能力,比如思考和視覺理解,計劃未來為該模型加入這些能力。此外,長文本處理能力曾是Kimi的核心優(yōu)勢,此次Kimi K2的上下文長度為128k,不及部分新發(fā)布的模型。

值得注意的是,Kimi K2是國內(nèi)首個開源的萬億參數(shù)級別模型。此前雖有其他大模型廠商訓練出萬億參數(shù)模型,如騰訊混元Turbo、MiniMax abab 6.5等,但都采取了閉源路線。

在訓練Kimi K2這樣的萬億參數(shù)級別的大模型時,月之暗面采用了自主創(chuàng)新的Muon優(yōu)化器。與傳統(tǒng)的Adam優(yōu)化器相比,Muon在token利用效率上表現(xiàn)更優(yōu),能讓大模型學得更快、更有效率。同時為解決Muon在超大規(guī)模訓練時遇到的不穩(wěn)定問題,團隊還提出了MuonClip這一穩(wěn)定性增強技術(shù),支撐Kimi K2順利完成15.5萬億tokens的預訓練,未出現(xiàn)訓練損失值的異常峰值。

自年初DeepSeek橫空出世以來,月之暗面雖然陸續(xù)釋出了一些技術(shù)或產(chǎn)品上的更新,但始終未能重拾外界對其的熱切期待,一度表現(xiàn)得頗為低調(diào)沉寂。而此次Kimi K2的發(fā)布,讓這家明星創(chuàng)企終于重回基模舞臺的聚光燈下,這場牌局仍未見定論。

原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/727914.html

科技探索者的頭像科技探索者管理團隊

相關(guān)推薦

發(fā)表回復

登錄后才能評論