阿里Qwen-2成全球开源大模型排行榜第一，中国处于领导地位。

AIGC动态2年前 (2024)发布 AIGCOPEN

3,520 0 0

文章摘要

【关键词】 开源大模型、Qwen2-72B、性能评测、中国领先、技术创新

全球开源平台huggingface的联合创始人兼首席执行官Clem宣布，阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上位居第一。为了提供更准确的评估，使用了300块H100对全球100多个主流开源大模型在多个基准测试集上进行了重新评估。重新评估的原因是开发者过分注重排行榜名次，使用评估集数据进行训练，且之前的评估流程对模型来说过于简单。结果显示，Qwen-2 72B超越了Meta的Llama-3、Mistralai的Mixtral等，中国在全球开源大模型领域处于领导地位。

排行榜数据显示，Meta的Llama-3-70B指令微调版本位列第二，阿里的Qwen2-72B基础版本排名第三，Mistralai的Mixtral-8x22B指令微调版本排名第四。微软的小参数模型Phi-3-Medium-4K 14B排名第五，表明小参数模型经过高质量数据集预训练后，也能实现与大参数模型相媲美的能力。中国零一万物的Yi-1.5-34B-Chat版本排在第六名，Cohere的Command R+ 104B排名第七，英伟达的Smaug-72B-v0.1排名第八，第九和第十名均为阿里之前开源的Qwen1.5基础和Chat版本。

StabilityAI的研究总监Tanishq表示，中国在开源大模型领域具有竞争力，除了Qwen2外，还有零一万物、InternLM、Deepsseek等知名开源模型。他认为，中国在开源大模型领域处于领导者地位。在ElyzaTasks100性能评测中，Qwen2-72B的指令微调版本也是性能最高的开源大模型之一，仅次于OpenAI的GPT-4o，高于谷歌的Gemini1.5Pro。在与OpenAI、Anthropic等闭源大模型平台的PK中，Qwen2-72B指令微调版本也表现出色，是中国唯一进入美国评估标准前10的公司。

期待阿里巴巴继续努力，发布更多高性能的开源大模型，为全人类带来福祉。