Qwen3 这波更新真猛，一下子成了全球最强编程模型

831 0 0

文章摘要

大模型的演进持续加速，国内外公司之间的竞争态势依然激烈。当前，模型的发展呈现出两个显著趋势：编程能力成为核心关注点，以及开源模型的快速进步。与早期更注重文字生成不同，如今模型的编程能力成为衡量其性能的重要指标。开源模型虽然与头部闭源模型仍存在差距，但差距正在逐渐缩小，且开源模型在性价比方面具有明显优势。

阿里最近发布的Qwen3-Coder是专为编程场景设计的新一代模型，其预训练数据中代码占比接近70%。该模型采用MoE架构，总参数量达480B，激活参数为35B，原生支持256K上下文，并通过YaRN扩展至1M，极大提升了上下文处理能力。在SWE-bench测试中，Qwen3-Coder的修复成功率达到69.6%，接近最强的闭源模型Claude-Sonnet-4的70.4%，显示出其在编程任务中的强大实力。

除了编程效果，模型的上下文能力、速度和价格也是关键因素。上下文窗口的扩展为行业带来了显著利好，Qwen3-Coder将上下文扩展至1M，进一步提升了其处理复杂任务的能力。速度方面，Qwen3-Coder在生成代码时的响应速度表现优异，能够有效支持程序员的创作流程。价格方面，Qwen3-Coder的API采用阶梯定价，与Claude等闭源模型相比更具性价比，为中小企业和开发者提供了更经济的选择。

Qwen3-Coder的发布标志着阿里在代码生成领域的深入布局。该模型支持358种编程语言，并在多个任务上取得了开源模型的最佳效果。相较于之前的版本，Qwen3-Coder更像是一个明确的信号，表明阿里正在代码生成领域进行长期投入。其开源特性也为行业提供了更多选择，减少了对闭源模型的依赖。

此外，阿里还推出了基于Gemini CLI的Qwen Code，这是一个命令行编程Agent，能够访问本地文件系统、执行终端命令并浏览网页。Qwen Code的推出进一步丰富了开发者的工具链，提升了编程效率。随着AI编程工具的快速发展，大模型正逐渐成为程序员的新型生产力工具，Qwen3-Coder的发布无疑为这一趋势注入了新的动力。