阿里Qwen3-Coder携1M上下文杀来！5分钟生成网站，开发者狂欢：Claude Code可以卸载了

656 0 0

文章摘要

阿里正式发布了其最新的代码模型Qwen3-Coder，该模型被认为是迄今为止最具代理能力的代码模型之一。Qwen3-Coder有多个版本，其中最引人注目的是Qwen3-Coder-480B-A35B-Instruct，这是一个拥有480B参数和35B激活参数的混合专家（MoE）模型。该模型原生支持256K token的上下文，并可通过YaRN扩展到1M token，具备卓越的代码和Agent能力。Qwen3-Coder支持358种编程语言，在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use等任务上取得了开源模型的SOTA效果，与Claude Sonnet4相媲美。

与此同时，阿里还推出并开源了一款用于代理式编程的命令行工具Qwen Code。Qwen Code基于Gemini CLI进行二次开发，针对Qwen3-Coder系列模型增强了解析器和工具支持，以最大程度激发Qwen3-Coder在Agentic Coding任务上的表现。Qwen Code可以与社区中的其他优秀编程工具结合，如Claude Code和Cline等，进一步提升开发者的工作效率。

Qwen3-Coder的训练过程包括预训练和后训练两个阶段。在预训练阶段，团队通过数据扩展、上下文扩展和合成数据扩展等手段，显著提升了模型的代码能力。总计7.5T的训练数据中，代码占比70%，确保了模型在保持通用与数学能力的同时，具备卓越的编程能力。在后训练阶段，团队在更丰富的真实代码任务上进行了扩展Code RL训练，通过自动扩展测试样例，构造了大量高质量的训练实例，显著提升了代码执行成功率。

Qwen3-Coder在多个评测中表现出色，尤其是在浏览器调用（WebArena）、工具调用（BFCL）等Agent能力评测中，刷新了开源模型的纪录，超越了GPT4.1。在考察模型自主规划解决编程任务的SWE-Bench评测中，Qwen3-Coder取得了开源最佳效果，媲美Claude4。该模型具备出色的Agent能力，尤其擅长解决多步骤的长任务，能够通观全局自主安排工作内容，支持Agent调用各种工具深入钻研，最终解决复杂编程任务。

Qwen3-Coder的发布受到了开发者的热烈欢迎。SnapEdit联合创始人兼首席执行官Oscar Le表示，Qwen3-Coder的推出使得开发者不再需要每月花费200美元购买Claude Code。苹果研究员Yufan Zhuang也称赞Qwen3-Coder正在推动开源人工智能研究。官方实测数据显示，Qwen3-Coder在执行任务时能够调用的工具数量比Claude多几倍，效果非常出色。

Qwen3-Coder不仅能够帮助程序员完成基础的编程任务，如写代码、补全代码、修Bug等，还极大降低了普通人入门编程的门槛。例如，一句话就能生成精妙复杂的3D物理模拟过程，编程工作效率大幅提升，代码测试、查询生成等工作从人工编写的数小时骤降至数分钟。

目前，Qwen3-Coder已在魔搭社区、HuggingFace等平台开源，全球开发者都可以免费下载使用。截至发稿前，该模型已在Github上获得5.1k stars。此外，Qwen3-Coder很快将接入阿里的AI编程产品通义灵码，API也已上线阿里云百炼。