DeepSeek-R1模型正式發(fā)布,性能媲美OpenAI o1

DeepSeek-R1模型正式發(fā)布,性能媲美OpenAI o1

昨日,知名量化投資公司幻方量化旗下的AI子公司深度求索(DeepSeek)正式推出了其最新研發(fā)的AI模型——DeepSeek-R1。據(jù)悉,該模型在數(shù)學(xué)計(jì)算、代碼生成以及自然語言推理等多項(xiàng)任務(wù)上的表現(xiàn),已經(jīng)能夠與OpenAI的o1正式版相媲美,展現(xiàn)出強(qiáng)大的性能實(shí)力。

DeepSeek公司透露,R1模型在后訓(xùn)練階段大規(guī)模運(yùn)用了強(qiáng)化學(xué)習(xí)技術(shù)。這一創(chuàng)新舉措使得模型在僅有極少標(biāo)注數(shù)據(jù)的情況下,依然能夠顯著提升其推理能力。值得注意的是,DeepSeek不僅將R1模型的訓(xùn)練技術(shù)全面公開,還額外蒸餾了6個(gè)小模型并開放給社區(qū),以便用戶能夠借此基礎(chǔ)訓(xùn)練出更多樣化的AI模型。

在價(jià)格方面,DeepSeek-R1模型的API使用費(fèi)用也頗具競爭力。每百萬輸入tokens的價(jià)格為1元(緩存命中)或4元(緩存未命中),而每百萬輸出tokens的價(jià)格則為16元。相較于OpenAI的o1正式版,這一價(jià)格水平低了27至55倍,為用戶提供了更為經(jīng)濟(jì)高效的選擇。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.2079x.cn/article/703531.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論