近日,基準(zhǔn)測試平臺Chatbot Arena發(fā)布了最新的大模型盲測排名。10天前發(fā)布的阿里通義千問開源模型Qwen2.5再次闖入全球十強,其Qwen2.5-72B-Instruct大語言模型在榜單中位列第十,是前十名中唯一的中國模型。此外,通義千問的視覺語言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的開源大模型。
與此同時,基于Qwen系列的衍生模型在全球開源社區(qū)中的數(shù)量已突破7.43萬,超過了Llama系列的7.28萬,成為全球最大的生成式語言模型家族。在Hugging Face社區(qū)的開源模型排行榜Open LLM Leaderboard上,Qwen系列及其衍生模型包攬了前十全部座次。
Chatbot Arena由開放研究機構(gòu)LMSYS Org推出,是目前全球頂尖的大模型測試平臺。平臺目前集成了全球70多個大模型,采用匿名方式將大模型兩兩組隊,交給用戶進(jìn)行盲測,用戶根據(jù)真實對話體驗對模型能力進(jìn)行投票。
原創(chuàng)文章,作者:潮玩君,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/684168.html