阿里千问 3 登顶全球最强开源模型，性能超越 DeepSeek-R1、OpenAI-o1

68 0 0

文章摘要

阿里巴巴最新发布的开源模型Qwen3（通义千问3）在性能、成本和灵活性方面取得了显著突破，成为全球最强开源模型。该模型采用混合专家（MoE）架构，总参数量为235B，但激活仅需22B，显著降低了算力消耗。Qwen3的混合推理模型将“快思考”与“慢思考”集成在同一框架内，能够根据需求快速响应简单问题或进行多步骤深度思考，从而大幅提升效率。在多项国际评测中，Qwen3表现优异，例如在AIME25奥数测评中斩获81.5分，在LiveCodeBench代码能力评测中突破70分，在ArenaHard人类偏好对齐测评中以95.6分超越OpenAI-o1和DeepSeek-R1等顶尖模型。

Qwen3的部署成本也显著降低，仅需4张H20即可部署满血版，显存占用仅为性能相近模型的三分之一。该模型提供了丰富的版本选择，包括2款MoE模型和6款密集模型，每款均在同尺寸开源模型中实现了最佳性能。例如，30B参数的MoE模型仅激活3B即可媲美上代Qwen2.5-32B的性能，而32B版本的稠密模型则跨级超越了Qwen2.5-72B的性能。此外，Qwen3支持按需设置“思考预算”，灵活满足不同场景对性能和成本的需求，例如4B模型适合手机端，8B模型适用于电脑和汽车端侧，32B模型则受到企业大规模部署的青睐。

Qwen3还为智能体（Agent）和大模型应用提供了强大支持。在BFCL评测中，Qwen3以70.8分创下新高，超越Gemini2.5-Pro和OpenAI-o1等模型，显著降低了Agent调用工具的门槛。该模型原生支持MCP协议，并具备强大的工具调用能力，结合Qwen-Agent框架，能够简化编码复杂性，实现高效的手机和电脑Agent操作。

Qwen3系列模型采用Apache2.0协议开源，支持119种语言，全球开发者、研究机构和企业可通过魔搭社区、HuggingFace等平台免费下载并商用，也可通过阿里云百炼调用API服务。个人用户可通过通义APP直接体验Qwen3，夸克也将全线接入该模型。截至目前，阿里通义已开源200余个模型，全球下载量超3亿次，千问衍生模型数超10万个，超越美国Llama，成为全球第一开源模型。