
文章摘要
阿里正式发布了其最新的代码模型Qwen3-Coder,该模型被认为是迄今为止最具代理能力的代码模型之一。Qwen3-Coder有多个版本,其中最引人注目的是Qwen3-Coder-480B-A35B-Instruct,这是一个拥有480B参数和35B激活参数的混合专家(MoE)模型。该模型原生支持256K token的上下文,并可通过YaRN扩展到1M token,具备卓越的代码和Agent能力。Qwen3-Coder支持358种编程语言,在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use等任务上取得了开源模型的SOTA效果,与Claude Sonnet4相媲美。
与此同时,阿里还推出并开源了一款用于代理式编程的命令行工具Qwen Code。Qwen Code基于Gemini CLI进行二次开发,针对Qwen3-Coder系列模型增强了解析器和工具支持,以最大程度激发Qwen3-Coder在Agentic Coding任务上的表现。Qwen Code可以与社区中的其他优秀编程工具结合,如Claude Code和Cline等,进一步提升开发者的工作效率。
Qwen3-Coder的训练过程包括预训练和后训练两个阶段。在预训练阶段,团队通过数据扩展、上下文扩展和合成数据扩展等手段,显著提升了模型的代码能力。总计7.5T的训练数据中,代码占比70%,确保了模型在保持通用与数学能力的同时,具备卓越的编程能力。在后训练阶段,团队在更丰富的真实代码任务上进行了扩展Code RL训练,通过自动扩展测试样例,构造了大量高质量的训练实例,显著提升了代码执行成功率。
Qwen3-Coder在多个评测中表现出色,尤其是在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,刷新了开源模型的纪录,超越了GPT4.1。在考察模型自主规划解决编程任务的SWE-Bench评测中,Qwen3-Coder取得了开源最佳效果,媲美Claude4。该模型具备出色的Agent能力,尤其擅长解决多步骤的长任务,能够通观全局自主安排工作内容,支持Agent调用各种工具深入钻研,最终解决复杂编程任务。
Qwen3-Coder的发布受到了开发者的热烈欢迎。SnapEdit联合创始人兼首席执行官Oscar Le表示,Qwen3-Coder的推出使得开发者不再需要每月花费200美元购买Claude Code。苹果研究员Yufan Zhuang也称赞Qwen3-Coder正在推动开源人工智能研究。官方实测数据显示,Qwen3-Coder在执行任务时能够调用的工具数量比Claude多几倍,效果非常出色。
Qwen3-Coder不仅能够帮助程序员完成基础的编程任务,如写代码、补全代码、修Bug等,还极大降低了普通人入门编程的门槛。例如,一句话就能生成精妙复杂的3D物理模拟过程,编程工作效率大幅提升,代码测试、查询生成等工作从人工编写的数小时骤降至数分钟。
目前,Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者都可以免费下载使用。截至发稿前,该模型已在Github上获得5.1k stars。此外,Qwen3-Coder很快将接入阿里的AI编程产品通义灵码,API也已上线阿里云百炼。
原文和模型
【原文链接】 阅读原文 [ 1986字 | 8分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆