
文章摘要
大模型的演进持续加速,国内外公司之间的竞争态势依然激烈。当前,模型的发展呈现出两个显著趋势:编程能力成为核心关注点,以及开源模型的快速进步。与早期更注重文字生成不同,如今模型的编程能力成为衡量其性能的重要指标。开源模型虽然与头部闭源模型仍存在差距,但差距正在逐渐缩小,且开源模型在性价比方面具有明显优势。
阿里最近发布的Qwen3-Coder是专为编程场景设计的新一代模型,其预训练数据中代码占比接近70%。该模型采用MoE架构,总参数量达480B,激活参数为35B,原生支持256K上下文,并通过YaRN扩展至1M,极大提升了上下文处理能力。在SWE-bench测试中,Qwen3-Coder的修复成功率达到69.6%,接近最强的闭源模型Claude-Sonnet-4的70.4%,显示出其在编程任务中的强大实力。
除了编程效果,模型的上下文能力、速度和价格也是关键因素。上下文窗口的扩展为行业带来了显著利好,Qwen3-Coder将上下文扩展至1M,进一步提升了其处理复杂任务的能力。速度方面,Qwen3-Coder在生成代码时的响应速度表现优异,能够有效支持程序员的创作流程。价格方面,Qwen3-Coder的API采用阶梯定价,与Claude等闭源模型相比更具性价比,为中小企业和开发者提供了更经济的选择。
Qwen3-Coder的发布标志着阿里在代码生成领域的深入布局。该模型支持358种编程语言,并在多个任务上取得了开源模型的最佳效果。相较于之前的版本,Qwen3-Coder更像是一个明确的信号,表明阿里正在代码生成领域进行长期投入。其开源特性也为行业提供了更多选择,减少了对闭源模型的依赖。
此外,阿里还推出了基于Gemini CLI的Qwen Code,这是一个命令行编程Agent,能够访问本地文件系统、执行终端命令并浏览网页。Qwen Code的推出进一步丰富了开发者的工具链,提升了编程效率。随着AI编程工具的快速发展,大模型正逐渐成为程序员的新型生产力工具,Qwen3-Coder的发布无疑为这一趋势注入了新的动力。
原文和模型
【原文链接】 阅读原文 [ 2903字 | 12分钟 ]
【原文作者】 AI产品阿颖
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★