阿里千问 3 登顶全球最强开源模型,性能超越 DeepSeek-R1、OpenAI-o1

AI-Agent19小时前发布 geekpark
68 0 0
阿里千问 3 登顶全球最强开源模型,性能超越 DeepSeek-R1、OpenAI-o1

 

文章摘要


【关 键 词】 开源模型性能推理成本

阿里巴巴最新发布的开源模型Qwen3(通义千问3)在性能成本和灵活性方面取得了显著突破,成为全球最强开源模型。该模型采用混合专家(MoE)架构,总参数量为235B,但激活仅需22B,显著降低了算力消耗。Qwen3的混合推理模型将“快思考”与“慢思考”集成在同一框架内,能够根据需求快速响应简单问题或进行多步骤深度思考,从而大幅提升效率。在多项国际评测中,Qwen3表现优异,例如在AIME25奥数测评中斩获81.5分,在LiveCodeBench代码能力评测中突破70分,在ArenaHard人类偏好对齐测评中以95.6分超越OpenAI-o1和DeepSeek-R1等顶尖模型。

Qwen3的部署成本也显著降低,仅需4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一。该模型提供了丰富的版本选择,包括2款MoE模型和6款密集模型,每款均在同尺寸开源模型中实现了最佳性能。例如,30B参数的MoE模型仅激活3B即可媲美上代Qwen2.5-32B的性能,而32B版本的稠密模型则跨级超越了Qwen2.5-72B的性能。此外,Qwen3支持按需设置“思考预算”,灵活满足不同场景对性能和成本的需求,例如4B模型适合手机端,8B模型适用于电脑和汽车端侧,32B模型则受到企业大规模部署的青睐。

Qwen3还为智能体(Agent)和大模型应用提供了强大支持。在BFCL评测中,Qwen3以70.8分创下新高,超越Gemini2.5-Pro和OpenAI-o1等模型,显著降低了Agent调用工具的门槛。该模型原生支持MCP协议,并具备强大的工具调用能力,结合Qwen-Agent框架,能够简化编码复杂性,实现高效的手机和电脑Agent操作。

Qwen3系列模型采用Apache2.0协议开源,支持119种语言,全球开发者、研究机构和企业可通过魔搭社区、HuggingFace等平台免费下载并商用,也可通过阿里云百炼调用API服务。个人用户可通过通义APP直接体验Qwen3,夸克也将全线接入该模型。截至目前,阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,超越美国Llama,成为全球第一开源模型。

原文和模型


【原文链接】 阅读原文 [ 931字 | 4分钟 ]
【原文作者】 极客公园
【摘要模型】 deepseek-v3
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...