昨日,知名量化投資公司幻方量化旗下的AI子公司深度求索(DeepSeek)正式推出了其最新研發(fā)的AI模型——DeepSeek-R1。據(jù)悉,該模型在數(shù)學(xué)計(jì)算、代碼生成以及自然語言推理等多項(xiàng)任務(wù)上的表現(xiàn),已經(jīng)能夠與OpenAI的o1正式版相媲美,展現(xiàn)出強(qiáng)大的性能實(shí)力。
DeepSeek公司透露,R1模型在后訓(xùn)練階段大規(guī)模運(yùn)用了強(qiáng)化學(xué)習(xí)技術(shù)。這一創(chuàng)新舉措使得模型在僅有極少標(biāo)注數(shù)據(jù)的情況下,依然能夠顯著提升其推理能力。值得注意的是,DeepSeek不僅將R1模型的訓(xùn)練技術(shù)全面公開,還額外蒸餾了6個(gè)小模型并開放給社區(qū),以便用戶能夠借此基礎(chǔ)訓(xùn)練出更多樣化的AI模型。
在價(jià)格方面,DeepSeek-R1模型的API使用費(fèi)用也頗具競爭力。每百萬輸入tokens的價(jià)格為1元(緩存命中)或4元(緩存未命中),而每百萬輸出tokens的價(jià)格則為16元。相較于OpenAI的o1正式版,這一價(jià)格水平低了27至55倍,為用戶提供了更為經(jīng)濟(jì)高效的選擇。
原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.2079x.cn/article/703531.html