阿里巴巴開(kāi)源Qwen1.5-110B模型，性能比肩Meta-Llama3-70B

AI ? 2024年4月28日 12:07:00 ? AI

近日，阿里巴巴宣布開(kāi)源了其Qwen1.5系列中的首個(gè)千億參數(shù)模型——Qwen1.5-110B。這一舉措不僅彰顯了阿里巴巴在人工智能領(lǐng)域的創(chuàng)新實(shí)力，也標(biāo)志著中國(guó)企業(yè)在大型語(yǔ)言模型領(lǐng)域取得了顯著進(jìn)展。

據(jù)悉，Qwen1.5-110B模型采用了Transformer解碼器架構(gòu)，并引入了分組查詢注意力（GQA）技術(shù)，使得模型在推理時(shí)更加高效。該模型支持長(zhǎng)達(dá)32K tokens的上下文長(zhǎng)度，具備多語(yǔ)言處理能力，支持包括英、中、法、西、德、俄、日、韓、越、阿等在內(nèi)的多種語(yǔ)言。

在性能評(píng)估方面，Qwen1.5-110B模型展現(xiàn)出了與Meta的Llama3-70B模型相媲美的實(shí)力。這一成績(jī)是在沒(méi)有大幅改變預(yù)訓(xùn)練方法的情況下取得的，阿里巴巴方面認(rèn)為，性能的提升主要?dú)w功于模型規(guī)模的增加。這一結(jié)果不僅證明了阿里巴巴在模型設(shè)計(jì)和優(yōu)化方面的專業(yè)能力，也為中國(guó)在大型語(yǔ)言模型領(lǐng)域的發(fā)展注入了新的活力。

除了在基礎(chǔ)能力評(píng)估中表現(xiàn)出色外，Qwen1.5-110B模型在Chat評(píng)估中也取得了優(yōu)異的成績(jī)。在MT-Bench和AlpacaEval 2.0這兩個(gè)Chat模型基準(zhǔn)評(píng)估中，該模型相較于之前發(fā)布的72B模型表現(xiàn)出了顯著的優(yōu)勢(shì)。這一結(jié)果進(jìn)一步證明了更大規(guī)模的基礎(chǔ)語(yǔ)言模型可以帶來(lái)更好的Chat模型性能。

阿里巴巴方面表示，Qwen1.5-110B是Qwen1.5系列中規(guī)模最大的模型，也是該系列中首個(gè)擁有超過(guò)1000億參數(shù)的模型。這一成就不僅彰顯了阿里巴巴在大型語(yǔ)言模型領(lǐng)域的領(lǐng)先地位，也為中國(guó)企業(yè)在全球人工智能競(jìng)爭(zhēng)中贏得了更多的話語(yǔ)權(quán)。

隨著人工智能技術(shù)的不斷發(fā)展，大型語(yǔ)言模型已經(jīng)成為了各大科技企業(yè)的重點(diǎn)研究方向。阿里巴巴此次開(kāi)源Qwen1.5-110B模型，不僅為開(kāi)發(fā)者提供了更加優(yōu)秀的工具，也為推動(dòng)人工智能技術(shù)的普及和應(yīng)用做出了積極的貢獻(xiàn)。

未來(lái)，我們期待看到更多中國(guó)企業(yè)在大型語(yǔ)言模型領(lǐng)域取得突破，為人工智能技術(shù)的發(fā)展和應(yīng)用注入更多的活力和創(chuàng)新力量。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.2079x.cn/article/651113.html

AI認(rèn)證作者

0 0

新聞

智能眼鏡大戰(zhàn)一觸即發(fā) Meta被曝聚焦開(kāi)發(fā)“超輕薄開(kāi)放式頭顯”

Meta宣布砍掉在售VR產(chǎn)品的升級(jí)項(xiàng)目，加速推出“超輕薄開(kāi)放式頭顯”，計(jì)劃明年發(fā)布智能眼鏡新品。Meta正在推進(jìn)代號(hào)為“Puffin”的超輕薄開(kāi)放式頭顯研發(fā)項(xiàng)目，目標(biāo)在2026年底前發(fā)布。

科技探索者
41分鐘前
商業(yè)

?拼多多一季度利潤(rùn)腰斬低價(jià)戰(zhàn)略難敵阿里京東圍剿

拼多多5月27日發(fā)布的2025年一季度財(cái)報(bào)引發(fā)市場(chǎng)震蕩。拼多多財(cái)報(bào)顯示，其營(yíng)收同比增長(zhǎng)10%至956.7億元，凈利潤(rùn)卻同比暴跌47%至147.4億元，兩項(xiàng)核心數(shù)據(jù)均大幅低于市場(chǎng)預(yù)期…

商業(yè)頭條
4天前
AI

?Meta發(fā)布Multi-SpatialMLLM模型，實(shí)現(xiàn)動(dòng)態(tài)場(chǎng)景精準(zhǔn)解析

Meta公司于5月28日發(fā)布革命性多模態(tài)大模型Multi-SpatialMLLM，通過(guò)整合深度感知、視覺(jué)對(duì)應(yīng)和動(dòng)態(tài)感知三大核心組件，成功突破傳統(tǒng)單幀圖像分析的局限性。該模型由Met…

AI
5天前
新聞

?消息稱Meta加速布局實(shí)體零售，正面挑戰(zhàn)蘋果“體驗(yàn)店模式”

據(jù)外媒報(bào)道，Meta正計(jì)劃大規(guī)模擴(kuò)張實(shí)體零售網(wǎng)絡(luò)，試圖復(fù)制蘋果“體驗(yàn)店模式”以強(qiáng)化品牌影響力。目前，Meta僅在美國(guó)加州伯林蓋姆運(yùn)營(yíng)一家名為“Meta Store”的實(shí)體店，該店自…

好奇寶寶
5天前
新聞

?WhatsApp正式登陸iPad：多任務(wù)協(xié)同與隱私保護(hù)成亮點(diǎn)

據(jù)報(bào)道，Meta旗下即時(shí)通訊應(yīng)用WhatsApp于5月28日正式推出iPad版本，結(jié)束了用戶長(zhǎng)達(dá)兩年的等待。即日起，用戶可通過(guò)蘋果App Store下載該應(yīng)用，在更大屏幕上體驗(yàn)端到…

校草
6天前
產(chǎn)品

Meta Ray-Ban智能眼鏡評(píng)測(cè) 為什么它能成“日常必備神器”？ ?

在充斥著概念炒作和短期熱度的可穿戴設(shè)備市場(chǎng)，Meta與Ray-Ban母公司EssilorLuxottica聯(lián)合推出的智能眼鏡卻創(chuàng)造了一個(gè)罕見(jiàn)現(xiàn)象：上市18個(gè)月銷量突破200萬(wàn)副，且…

科技探索者
2025年5月19日
商業(yè)

阿里巴巴年內(nèi)再度減持小鵬汽車累計(jì)套現(xiàn)超百億

阿里巴巴集團(tuán)近日公布的2025年一季度持倉(cāng)報(bào)告顯示，其再次減持308萬(wàn)股小鵬汽車股票，減持比例達(dá)8.13%。這已是該集團(tuán)連續(xù)第五個(gè)季度減持小鵬股份，僅今年一季度就套現(xiàn)約1.2億美元…

商業(yè)頭條
2025年5月18日
AI

Meta 推出 CATransformers 框架，AI 減排新利器

Meta AI聯(lián)手佐治亞理工學(xué)院研發(fā)低碳AI框架，通過(guò)多目標(biāo)貝葉斯優(yōu)化引擎平衡能耗、精度和碳足跡，針對(duì)邊緣推理設(shè)備優(yōu)化剪枝大型CLIP模型。研究結(jié)果顯示，綜合優(yōu)化碳排放與延遲的策略可實(shí)現(xiàn)19-20%的總排放削減，且延遲損失極小。

李小白
2025年5月15日
新聞

谷歌支付近百億創(chuàng)紀(jì)錄隱私和解金得州指控其非法追蹤用戶

當(dāng)?shù)貢r(shí)間5月10日，美國(guó)得克薩斯州總檢察長(zhǎng)辦公室宣布，谷歌已同意支付13.75億美元（約合99.57億元人民幣），終結(jié)該州對(duì)其“非法收集數(shù)百萬(wàn)用戶隱私數(shù)據(jù)”的指控。這一金額刷新了美…

Google
2025年5月11日
新聞

阿里否認(rèn)馬云將回歸傳聞：創(chuàng)始人從未離開(kāi)，回歸絕無(wú)可能

昨日，阿里巴巴集團(tuán)內(nèi)部人士向媒體證實(shí)，近日網(wǎng)傳“創(chuàng)始人馬云將于5月10日回歸并重啟大集團(tuán)模式”的消息不實(shí)，明確表示“創(chuàng)始人從未離開(kāi)，回歸絕無(wú)可能”。與此同時(shí)，阿里員工論壇權(quán)限調(diào)整、…

小丸子
2025年5月11日
新聞

馬云回應(yīng)回歸阿里傳聞：沒(méi)聽(tīng)說(shuō)！

針對(duì)近日網(wǎng)絡(luò)熱傳的”馬云將于5月10日回歸阿里重掌大局”的傳言，阿里巴巴集團(tuán)創(chuàng)始人馬云通過(guò)財(cái)視傳媒作出明確回應(yīng)：”沒(méi)聽(tīng)說(shuō)”。這是退休…

校草
2025年5月10日
新聞

?Instagram CEO披露競(jìng)爭(zhēng)內(nèi)幕：TikTok曾致美區(qū)用戶時(shí)長(zhǎng)暴跌23%

當(dāng)?shù)貢r(shí)間5月8日，美國(guó)聯(lián)邦貿(mào)易委員會(huì)（FTC）訴Meta反壟斷案庭審中，Instagram首席執(zhí)行官亞當(dāng)·莫塞里提交關(guān)鍵證詞，首度披露2018-2020年期間與TikTok競(jìng)爭(zhēng)的核…

net
2025年5月9日
商業(yè)

Meta Q1虛擬現(xiàn)實(shí)業(yè)務(wù)營(yíng)收下滑6% 雷朋聯(lián)名眼鏡熱銷難掩42億美元虧損

Meta公司近日公布旗下虛擬現(xiàn)實(shí)部門Reality Labs 2025年第一季度財(cái)報(bào)，該部門營(yíng)收為4.12億美元（約29.86億元人民幣），較去年同期4.4億美元下降約6%，虧損額…

商業(yè)頭條
2025年5月5日
新聞

日本將Meta、TikTok等五巨頭被納入強(qiáng)監(jiān)管

日本總務(wù)省4月30日正式宣布，將谷歌、LINE雅虎、Meta、TikTok及X（原Twitter）五家跨國(guó)互聯(lián)網(wǎng)企業(yè)納入《信息流通平臺(tái)對(duì)策法》監(jiān)管體系。該法案自4月1日生效以來(lái)首次…

好奇寶寶
2025年5月3日
出海

北美跨境包裹激增30% 菜鳥(niǎo)全球物流迎“中國(guó)貨”熱浪

最新數(shù)據(jù)顯示，阿里巴巴旗下菜鳥(niǎo)國(guó)際物流（CAINIAO）4月以來(lái)北美市場(chǎng)訂單量環(huán)比暴漲超30%，CAINIAO海外版App、集運(yùn)官網(wǎng)及社交平臺(tái)咨詢量連續(xù)三周創(chuàng)歷史新高。這是繼歐洲、…

野游栗
2025年4月29日
新聞

Meta旗下Threads全球廣告版圖擴(kuò)張：Advantage廣告系統(tǒng)默認(rèn)覆蓋

近日，Instagram負(fù)責(zé)人Adam Mosseri通過(guò)Threads官方賬號(hào)宣布，該社交平臺(tái)將全面擴(kuò)大廣告服務(wù)范圍。即日起，Meta旗下Advantage廣告投放系統(tǒng)新增&#8…

校草
2025年4月25日
AI

OpenAI計(jì)劃開(kāi)源首款A(yù)I模型推理性能對(duì)標(biāo)Meta、谷歌

近日，OpenAI正式確認(rèn)將推出自2019年GPT-2以來(lái)的首個(gè)開(kāi)源語(yǔ)言模型。據(jù)知情人士透露，該模型由研究副總裁Aidan Clark主導(dǎo)開(kāi)發(fā)，計(jì)劃于今年夏季初發(fā)布，其核心目標(biāo)是在…

AI
2025年4月24日
新聞

?阿里小號(hào)4月29日正式關(guān)停：用戶余額原路退回，客服通道保留至5月

阿里巴巴旗下虛擬運(yùn)營(yíng)商阿里通信向用戶群發(fā)通知，宣布“阿里小號(hào)”服務(wù)將于2025年4月29日24時(shí)全面關(guān)停并下線，所有對(duì)應(yīng)號(hào)碼將被回收。用戶賬戶內(nèi)剩余通信費(fèi)用將在10個(gè)工作日內(nèi)按原訂…

net
2025年4月24日
新聞

蘋果、Meta因違反歐盟新規(guī)被重罰7億歐元

當(dāng)?shù)貢r(shí)間4月23日，歐盟委員會(huì)宣布對(duì)蘋果及Meta分別處以5億歐元和2億歐元罰款，總計(jì)7億歐元（約合58.45億元人民幣）。這是歐盟《數(shù)字市場(chǎng)法案》（DMA）自2024年3月生效以…

李森
2025年4月24日
AI

字節(jié)跳動(dòng)CapCut遭下架后，Instagram推出Edits

在字節(jié)跳動(dòng)旗下視頻剪輯工具CapCut（剪映國(guó)際版）突遭蘋果App Store下架四個(gè)月后，Meta旗下Instagram今日正式發(fā)布全新視頻編輯器Edits。這款針對(duì)創(chuàng)作者深度定…

AI
2025年4月23日

發(fā)表回復(fù)

登錄后才能評(píng)論

阿里巴巴開(kāi)源Qwen1.5-110B模型，性能比肩Meta-Llama3-70B

相關(guān)推薦

發(fā)表回復(fù)