在编程模型领域,阿里巴巴Qwen团队近日宣布了一项重大进展,正式开源了其最新旗舰产品——Qwen3-Coder-480B-A35B-Instruct编程模型。这一动作标志着阿里巴巴在人工智能编程领域迈出了坚实的一步。
据Qwen团队介绍,Qwen3-Coder是他们目前最为强大的开源智能体编程模型,拥有4800亿个参数,其中激活参数达到350亿。该模型原生支持256K的上下文长度,并且能够通过外推技术,将上下文扩展至惊人的100万输入,最大输出则可达6.5万个token。这一性能的提升,无疑为程序员们提供了更为广阔的操作空间和更高的编程效率。
在基准测试中,Qwen3-Coder展现出了卓越的性能,特别是在AgenticCoding(智能体编程)、AgenticBrowser-Use(智能体浏览器使用)和AgenticTool-Use(智能体工具调用)这三类任务中,其表现均优于众多开源模型,如Kimi K2和DeepSeekV3等。更令人瞩目的是,Qwen3-Coder的表现甚至超越了部分闭源模型,如GPT-4.1,与以编程能力著称的ClaudeSonnet4模型相比也毫不逊色。
Qwen3-Coder还将推出多种尺寸供用户选择,而此次开源的是其最为强大的变体。虽然其参数量超过了阿里巴巴旗舰模型Qwen3的2350亿,但仍小于Kimi K2的1万亿。不过,这并不影响Qwen3-Coder在编程领域的强大表现。据阿里巴巴官方介绍,借助Qwen3-Coder,即使是刚入行的程序员也能在一天内完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。
除了Qwen3-Coder模型本身,Qwen团队还开源了一个基于GeminiCode分叉而来的智能体编程命令行工具——QwenCode。这一工具经过定制提示和函数调用协议的适配,能够充分发挥Qwen3-Coder在智能体编程任务上的能力,进一步提升编程效率和便捷性。
目前,Qwen3-Coder模型已在阿里云旗下的大模型服务平台百炼上线,其API采用阶梯计费方式,根据输入token量调整价格。在256K-1M这一档,输入价格为6美元/百万token,输出价格则为60美元/百万token。相比之下,ClaudeSonnet4的输入输出价格分别为3美元/百万token和15美元/百万token,与Qwen3-Coder的128k-256k一档价格相同。这一价格策略为用户提供了更多的选择空间,也进一步推动了人工智能编程模型的普及和应用。