
當?shù)貢r間4月6日,Meta在硅谷周末的平靜中突然投下AI核彈。這家科技巨頭在官網(wǎng)及開發(fā)者社區(qū)同步上線Llama 4系列,包含Scout、Maverick兩款即時可用模型,以及預告中的Behemoth模型。這是Meta首個基于混合專家(MoE)架構的開源模型家族,扎克伯格稱前兩款為”目前最先進的多模態(tài)型號”。?
Llama 4 Scout以16位專家架構實現(xiàn)170億激活參數(shù),單個H100 GPU即可運行,同時具備1000萬token上下文窗口。其多模態(tài)訓練數(shù)據(jù)涵蓋30萬億token的文本、圖像及視頻資源,視覺理解能力獲官方重點推介。更引人注目的是Llama 4 Maverick,采用128位專家架構的同參數(shù)規(guī)模設計,在代碼能力上與DeepSeek-V3持平,但參數(shù)效率提升50%。實測顯示該模型在文本推理、數(shù)學運算等場景超越GPT-4o和Gemini 2.0 Flash。?
雖然最高規(guī)格的Behemoth仍在訓練,Meta已披露其作為”新模型教師”的特殊定位。該模型使用16000塊H100 GPU集群訓練,能源消耗是前代的2.3倍,目標直指多模態(tài)數(shù)據(jù)清洗難題。目前Scout與Maverick已登陸Hugging Face等平臺,Meta AI助手同步在40國更新至Llama 4版本,但多模態(tài)功能暫限美區(qū)英語用戶。
此次發(fā)布被視作對DeepSeek等中國AI公司的直接回應。據(jù)開發(fā)者論壇消息,Meta內部曾組建特別小組研究DeepSeek-V3的成本控制方案。隨著Llama 4入局,全球開源模型競賽進入白熱化階段,Meta計劃在4月29日舉辦首屆LlamaCon大會,并預告第二季度推出獨立版AI助手應用。
原創(chuàng)文章,作者:AI,如若轉載,請注明出處:http://m.2079x.cn/article/713821.html