ITBear旗下自媒体矩阵:

阿里重磅推出Qwen3-Coder:强化学习驱动,重塑编程AI助手新标杆

   时间:2025-07-23 10:30:09 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

阿里巴巴今日震撼发布Qwen3-Coder,这款代码模型以其前所未有的代理能力,成为了业界关注的焦点。Qwen3-Coder系列中最为强大的版本——Qwen3-Coder-480B-A35B-Instruct,采用了创新的MoE架构设计,480B基础参数激活35B特定参数,不仅原生支持256K token的上下文处理,还能通过YaRN技术扩展至1M token,展现了卓越的代码生成与Agent能力。

Qwen3-Coder-480B-A35B-Instruct在Agentic Coding、Agentic Browser-Use及Agentic Tool-Use等多个领域取得了开源模型的顶尖成绩,其性能与Claude Sonnet4不相上下。阿里官方透露,借助Qwen3-Coder,新手程序员能够大幅提升工作效率,一天内完成的工作量相当于资深程序员一周的成果,甚至能在短短5分钟内生成一个品牌官网。

与此同时,阿里巴巴还推出了Qwen Code,这是一款专为代理式编程设计的命令行工具。Qwen Code基于Gemini Code进行深度优化,通过定制化的prompt和工具调用协议,最大限度地激发了Qwen3-Coder在Agentic Coding任务上的潜力。Qwen3-Coder还能与Claude Code、Cline等社区内的优秀编程工具无缝集成,为用户提供多样化的编程体验。

目前,Qwen3-Coder已在阿里云旗下的百炼大模型服务平台上线,其API采用灵活的阶梯计费模式,根据用户的输入token量调整价格。在256K至1M的输入范围内,价格为6美元/百万token(输入)和60美元/百万token(输出),相比之下,Claude Sonnet 4的输入输出价格分别为3美元/百万token和15美元/百万token,与Qwen3-Coder在128k至256k档位的定价相当。

为了提升Qwen3-Coder的代码能力,阿里巴巴从多个维度进行了模型优化。数据方面,总计7.5T的训练数据(其中70%为代码),确保了模型在保持通用与数学能力的同时,拥有出色的编程技能。上下文处理上,模型原生支持256K的上下文长度,并可通过YaRN技术扩展至1M,专为处理大型代码仓库和动态数据(如Pull Request)而设计。阿里巴巴还利用Qwen2.5-Coder对低质数据进行清洗与重写,显著提升了整体数据质量。

在强化学习方面,阿里巴巴采取了独特的策略,不仅在丰富的真实代码任务上扩展了Code RL训练,还通过自动扩展测试样例,构造了大量高质量的训练实例,成功释放了强化学习的潜力。在Long-Horizon RL阶段,模型学会了在真实软件工程环境中进行多轮交互,包括规划、执行、接受反馈和再决策。同时,阿里巴巴还实现了可验证环境的扩展系统,借助阿里云的基础设施,能够同时运行20k个独立环境,为模型提供了大规模的强化学习反馈和评测。

Qwen3-Coder的推出,标志着阿里巴巴在编程AI助手领域的又一重大突破。通过多元化的使用方案和生态集成,Qwen3-Coder降低了开发者的接入门槛,为编程行业带来了全新的变革。无论是通过自研的Qwen Code工具,还是与Claude Code、Cline等主流编程工具的集成,Qwen3-Coder都能为用户提供高效、便捷的编程体验。随着企业对自动化编程需求的不断增长,Qwen3-Coder的市场前景值得期待。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version