阿里集团近期震撼发布了其最新的通义千问AI编程大模型——Qwen3-Coder,这一创新成果标志着阿里在编程模型领域取得了全球领先的地位,其能力直逼业界标杆Claude4。这款模型的推出,预示着编程效率将迎来前所未有的提升。
Qwen3-Coder作为千问系列中的佼佼者,首次采用了混合专家MoE架构,其总参数高达480B,激活参数为35B,能够原生支持256K token的上下文处理,并可根据需求扩展至1M长度。在预训练阶段,Qwen3-Coder在代码占比高达70%的7.5T数据集上进行了深度学习,随后通过强化学习针对编程任务和智能体任务进行了后训练,从而在通用能力、代码能力和Agent能力上实现了质的飞跃。
Qwen3-Coder的Agent能力尤为突出,它擅长处理复杂的多步骤任务,能够自主规划工作内容,并调用各种工具进行深入研究和解决编程难题。在WebArena和BFCL等Agent能力评测中,Qwen3-Coder刷新了开源模型的记录,表现超越了GPT4.1。而在SWE-Bench评测中,Qwen3-Coder更是取得了开源模型中的最佳成绩,与Claude4不相上下。
这款模型的出现,将极大地提升编程工作的效率。对于刚入行的程序员来说,借助Qwen3-Coder,他们一天内就能完成资深程序员一周的工作量。例如,生成一个品牌官网的过程,从人工编写的数小时缩短至最快只需5分钟。Qwen3-Coder还能帮助程序员轻松完成写代码、补全代码和修Bug等基础任务,使编程工作变得更加高效。
Qwen3-Coder不仅提升了专业程序员的效率,还极大地降低了普通人入门编程的门槛。通过AI氛围编程(Vibe Coding),用户只需一句话就能生成复杂精细的3D物理模拟过程,让编程变得更加直观和易上手。
目前,Qwen3-Coder已在魔搭社区和HuggingFace等平台开源,全球开发者均可免费下载和使用。未来,它还将接入阿里的AI编程产品通义灵码,并通过阿里云百炼提供API服务。为了方便开发者更好地利用Qwen3-Coder,通义团队还推出了命令行工具Qwen Code,该工具能够充分发挥Qwen3-Coder在代理式编程上的优势。Qwen3-Coder的API还可以与Claude Code、Cline等工具协同工作,为用户提供更加全面的编程解决方案。
据统计,千问系列编程模型自发布以来,全球下载量已突破2000万次,成为备受欢迎的开源编程模型。阿里巴巴内部已大量采用AI编程技术,而一汽集团、中国石油、建设银行、平安集团、南方航空、小鹏汽车等行业领军企业也纷纷接入了千问AI编程模型,以期提升业务效率和创新能力。