最强开源编程模型,来了。
7月23日清晨,阿里正式发布并开源全新的通义千问AI编程大模型Qwen3-Coder。据悉,这是阿里迄今为止最具代理能力的代码模型,编程能力登顶全球开源模型阵营,并超越GPT4.1等闭源模型,比肩全球最强的编程模型Claude 4。
作为千问系列模型中首个采用混合专家MoE架构的代码模型,Qwen3-Coder的总参数达到480B,激活参数为35B,原生支持256K上下文并可扩展至1M长度。据通义千问团队介绍,Qwen3-Coder是在代码占比70%的7.5T数据上进行预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及智能体能力的飞升。
Qwen3-Coder拥有多个尺寸,其中最强大的版本Qwen3-Coder-480B-A35B-Instruct在基准测试中,在编程和智能体任务上拥有优秀的性能,在Agentic Coding(智能体编程)、Agentic Browser-Use(智能体浏览器使用)和Agentic Tool-Use(智能体工具调用)三类任务中获得了开源SOTA(“StateoftheArt”,意思是最先进的水平),可以与Claude Sonnet 4媲美。实测数据显示,在执行任务时,Qwen3-Coder能够调用的工具数量比Claude多几倍,效果非常出色。
值得注意的是,今年以来在程序员圈子中非常火爆的“氛围编程”,Qwen3-Coder也具备相关功能。Qwen3-Coder能帮助程序员完成基础编程任务,比如写代码、补全代码、修Bug等,编程工作效率大幅提升,代码测试、查询生成等工作从人工编写的数小时骤降至数分钟。据阿里官方介绍,借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。借助Qwen3-Coder,普通人用一句话也能生成精妙复杂的3D物理模拟过程,极大降低了入门编程的门槛。
Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者都可以免费下载使用。价格方面,Qwen3-Coder采用阶梯计费的方式,根据输入token量调整价格。在256K—1M一档,其输入价格为6美元/百万token,输出价格为60美元/百万token。业内人士指出,开源的Qwen3-Coder有望取代昂贵的Claude,成为Agent领域最受欢迎的编程模型。
在当前的AI全球竞争中,代码推理和编程成为了检验模型性能的重要领域,AI编程助手也正成为科技巨头角力的新战场。今年以来,无论是微软、谷歌等大厂,还是OpenAI、Anthropic等大模型明星创业公司,都在加大AI编程领域的投入与布局。最近,谷歌以24亿美元引入初创公司Windsurf核心团队及技术的消息,更进一步凸显了科技巨头间在代理式编程与AI人才上的激烈竞争。
SensorTower数据显示,今年3至4月,ChatGPT用户请求中有近29%与编程相关,反映出企业用户对AI辅助开发的兴趣。业内人士分析指出,对于微软和谷歌等大厂,AI编程有利于补强云服务生态黏性。对于同时提供B端和C端服务的大模型公司,提供擅长编码任务的模型+下探到Agent,可能是在大模型商业化路径上的一次重大机会点。
在这样的背景下,阿里的Qwen3-Coder编程能力登顶全球开源模型阵营,是国产编程模型的一次新突破。同时,阿里云表示将继续提升Coding Agent效果,并计划推出更多模型尺寸版本,在保证效果的同时降低部署成本。
据阿里方面的最新数据,截至目前,阿里千问系列编程模型全球下载量已突破2000万次,是全球最受欢迎的开源编程模型。据悉,阿里巴巴内部已开始大量使用AI编程。一汽集团、中国石油、建设银行、平安集团、南方航空、小鹏汽车等各行业头部企业也已接入千问AI编程模型。
校对:赵燕
版权声明