科技巨頭們的AI大模型早已拉開了序幕,互聯(lián)網(wǎng)公司百度和阿里已經(jīng)發(fā)布了各自的大模型,而近日騰訊也曝光了自己的大模型。科技訊今日發(fā)現(xiàn),雖然小米公司沒有公開宣布自己加入大模型之戰(zhàn),但我們卻在Github上發(fā)現(xiàn)了小米大模型的蹤影。
在Github小米這樣介紹MiLM-6B:MiLM-6B是由小米開發(fā)的一個大規(guī)模預(yù)訓(xùn)練語言模型,參數(shù)規(guī)模為64億。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。除了Github小米的AI大模型MiLM-6B還進入了C-Eval、CMMLU大模型評測榜單,截至當前,小米大模型在C-Eval 總榜單排名第10、同參數(shù)量級排名第 1。
根據(jù) GitHub 項目頁給出的信息得知,MiLM-6B 是由小米公司開發(fā)的一個大規(guī)模預(yù)訓(xùn)練語言模型,參數(shù)規(guī)模達 64 億。
而根據(jù) C-Eval 給出的信息,MiLM-6B 模型在具體各科目成績上,在 STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué)教育)全部 20 個科目中,計量師、物理、化學(xué)、生物等多個項目獲得了較高的準確率。
MiLM-6B 模型目前已經(jīng)在大多數(shù)文科科目中表現(xiàn)出了相對良好的準確度,不過在“法學(xué)、數(shù)學(xué)、編程、概率論、離散數(shù)學(xué)”等涉及“抽象思維”的科目中,還有一定進步空間。
在 10 個“社會科學(xué)”測試科目中,除“教育學(xué)和地理”外,該模型在其他 8 個科目中都獲得了較為理想的準確率。在人文科學(xué)的 11 個科目中,MiLM-6B 則在“歷史與法律”基礎(chǔ)上有著不錯的準確率表現(xiàn)。
AI 大模型 MiLM-6B 當下才首次曝光,不過完成度已經(jīng)較高,在未來該模型可能會被用于小米旗下“小愛同學(xué)”等虛擬助理服務(wù)中。
原創(chuàng)文章,作者:小科同學(xué),如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/575604.html