阿里巴巴Qwen团队于近日宣布了一项重大进展,他们正式开源了最新的旗舰级编程模型Qwen3-Coder-480B-A35B-Instruct。这一消息在科技圈内引起了广泛关注。
据了解,Qwen3-Coder是Qwen团队目前最为强大的开源智能体编程模型,拥有惊人的4800亿参数,其中激活参数达到350亿。该模型原生支持256K的上下文长度,并可通过外推技术将上下文扩展至100万输入,最大输出能力更是高达6.5万token。这一性能参数无疑为编程模型树立了新的标杆。
在基准测试中,Qwen3-Coder展现出了卓越的性能。特别是在AgenticCoding(智能体编程)、AgenticBrowser-Use(智能体浏览器使用)和AgenticTool-Use(智能体工具调用)这三类任务中,Qwen3-Coder均取得了优异的成绩,不仅超越了众多开源模型,如Kimi K2和DeepSeekV3,甚至与闭源模型GPT-4.1相比也毫不逊色,与以编程能力著称的ClaudeSonnet4模型更是势均力敌。
Qwen3-Coder还将推出多种尺寸版本,以满足不同用户的需求。而此次开源的是其最为强大的变体版本。虽然其参数量超过了阿里旗舰模型Qwen3的2350亿,但仍小于Kimi K2的1万亿参数。不过,这并不影响Qwen3-Coder在编程领域的强大实力。
借助Qwen3-Coder,即使是刚入行的程序员也能大幅提升工作效率。据阿里官方介绍,使用该模型,一天内就能完成资深程序员一周的工作量。例如,生成一个品牌官网最快只需5分钟,这对于网站建设和开发领域来说无疑是一个巨大的福音。
除了Qwen3-Coder模型本身,Qwen团队还开源了一个基于GeminiCode分叉而来的智能体编程命令行工具——QwenCode。这一工具经过定制提示和函数调用协议的适配,能够充分发挥Qwen3-Coder在智能体编程任务上的能力,进一步提升用户的编程体验。
目前,Qwen3-Coder模型已在阿里云旗下的大模型服务平台百炼上线。其API采用阶梯计费方式,根据输入token量调整价格。在256K-1M这一档,输入价格为6美元/百万token,输出价格为60美元/百万token。相比之下,ClaudeSonnet4的输入输出价格分别为3美元/百万token和15美元/百万token,与Qwen3-Coder的128k-256k一档价格相当。