阿里巴巴旗下的Qwen团队近日宣布了一项重大进展,他们最新一代的旗舰编程模型Qwen3-Coder-480B-A35B-Instruct已正式向公众开源。这款模型被Qwen团队誉为迄今为止最强大的开源智能体编程模型,不仅在参数规模上达到了480B,而且在智能体编程、浏览器使用以及工具调用等多个任务上均展现出卓越的性能。
据Qwen团队介绍,Qwen3-Coder在基准测试中取得了开源领域的顶尖成绩,超越了包括Kimi K2、DeepSeek V3在内的多个开源模型,以及闭源模型GPT-4.1,其表现甚至可与以编程能力见长的Claude Sonnet 4相媲美。这款模型原生支持256K上下文,并可通过特殊技术扩展至100万上下文,最大输出达到6.5万token,为用户提供了前所未有的编程体验。
除了强大的模型本身,Qwen团队还开源了一个基于Gemini Code分叉而来的智能体编程命令行工具——Qwen Code。这款工具经过定制提示和函数调用协议的适配,能够更充分地释放Qwen3-Coder在智能体编程任务上的潜力,为用户提供更加便捷、高效的编程体验。
Qwen3-Coder已在阿里云旗下的大模型服务平台百炼上线,其API采用阶梯计费方式,根据输入token量调整价格。用户可以根据自身需求选择合适的计费档位,灵活控制成本。Qwen3-Coder的480B版本也已在Hugging Face、魔搭等开源社区发布,供用户下载和本地部署。
在Qwen3-Coder发布前,这一模型已经悄然在Qwen Chat官网上线,引发海外网友的一片热议。不少网友分享了实测案例,展示了Qwen3-Coder在指令遵循、UI设计、动画等方面的惊人能力。例如,有网友让Qwen3-Coder打造一个Wordle单词游戏,结果模型不仅快速交付了游戏页面和源代码,而且在审美和用户体验上也达到了较高水准。
在技术层面,Qwen团队在博客中分享了Qwen3-Coder的部分训练细节。预训练阶段,模型使用了7.5万亿token数据,其中代码占比高达70%,确保了模型在编程方面的卓越表现。后训练阶段,Qwen团队引入了长视距强化学习,鼓励模型通过多轮交互解决现实世界任务,进一步提升了模型的实用性和泛化能力。
Qwen团队表示,他们仍在不断努力提升Coding Agent的性能,旨在让它承担更多复杂和乏味的软件工程任务,从而释放人类的生产力。未来,Qwen3-Coder的更多模型尺寸也将陆续推出,以满足不同用户的需求和场景。