阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位。

AIGC动态5个月前发布 AIGCOPEN
707 0 0
阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位。

 

文章摘要


【关 键 词】 开源大模型Qwen2-72B性能评测中国领先技术创新

全球开源平台huggingface的联合创始人兼首席执行官Clem宣布,阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上位居第一。为了提供更准确的评估,使用了300块H100对全球100多个主流开源大模型在多个基准测试集上进行了重新评估。重新评估的原因是开发者过分注重排行榜名次,使用评估集数据进行训练,且之前的评估流程对模型来说过于简单。结果显示,Qwen-2 72B超越了Meta的Llama-3、Mistralai的Mixtral等,中国在全球开源大模型领域处于领导地位

排行榜数据显示,Meta的Llama-3-70B指令微调版本位列第二,阿里的Qwen2-72B基础版本排名第三,Mistralai的Mixtral-8x22B指令微调版本排名第四。微软的小参数模型Phi-3-Medium-4K 14B排名第五,表明小参数模型经过高质量数据集预训练后,也能实现与大参数模型相媲美的能力。中国零一万物的Yi-1.5-34B-Chat版本排在第六名,Cohere的Command R+ 104B排名第七,英伟达的Smaug-72B-v0.1排名第八,第九和第十名均为阿里之前开源的Qwen1.5基础和Chat版本。

StabilityAI的研究总监Tanishq表示,中国在开源大模型领域具有竞争力,除了Qwen2外,还有零一万物、InternLM、Deepsseek等知名开源模型。他认为,中国在开源大模型领域处于领导者地位。在ElyzaTasks100性能评测中,Qwen2-72B的指令微调版本也是性能最高的开源大模型之一,仅次于OpenAI的GPT-4o,高于谷歌的Gemini1.5Pro。在与OpenAI、Anthropic等闭源大模型平台的PK中,Qwen2-72B指令微调版本也表现出色,是中国唯一进入美国评估标准前10的公司

期待阿里巴巴继续努力,发布更多高性能的开源大模型,为全人类带来福祉。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 1346字 | 6分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆

© 版权声明

相关文章

暂无评论

暂无评论...