ITBear旗下自媒体矩阵:

阿里开源480B参数编程模型Qwen3-Coder,超越Kimi K2,强化学习训练细节公开

   时间:2025-07-24 05:42:21 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

阿里巴巴旗下的Qwen团队近日宣布了一项重大进展,他们最新一代的旗舰编程模型Qwen3-Coder-480B-A35B-Instruct已正式向公众开源。这款模型被Qwen团队誉为迄今为止最强大的开源智能体编程模型,不仅在参数规模上达到了480B,而且在智能体编程、浏览器使用以及工具调用等多个任务上均展现出卓越的性能。

据Qwen团队介绍,Qwen3-Coder在基准测试中取得了开源领域的顶尖成绩,超越了包括Kimi K2、DeepSeek V3在内的多个开源模型,以及闭源模型GPT-4.1,其表现甚至可与以编程能力见长的Claude Sonnet 4相媲美。这款模型原生支持256K上下文,并可通过特殊技术扩展至100万上下文,最大输出达到6.5万token,为用户提供了前所未有的编程体验。

Qwen3-Coder性能对比图

除了强大的模型本身,Qwen团队还开源了一个基于Gemini Code分叉而来的智能体编程命令行工具——Qwen Code。这款工具经过定制提示和函数调用协议的适配,能够更充分地释放Qwen3-Coder在智能体编程任务上的潜力,为用户提供更加便捷、高效的编程体验。

Qwen3-Coder已在阿里云旗下的大模型服务平台百炼上线,其API采用阶梯计费方式,根据输入token量调整价格。用户可以根据自身需求选择合适的计费档位,灵活控制成本。Qwen3-Coder的480B版本也已在Hugging Face、魔搭等开源社区发布,供用户下载和本地部署。

在Qwen3-Coder发布前,这一模型已经悄然在Qwen Chat官网上线,引发海外网友的一片热议。不少网友分享了实测案例,展示了Qwen3-Coder在指令遵循、UI设计、动画等方面的惊人能力。例如,有网友让Qwen3-Coder打造一个Wordle单词游戏,结果模型不仅快速交付了游戏页面和源代码,而且在审美和用户体验上也达到了较高水准。

Qwen3-Coder打造的3D旋转立方体展示台

在技术层面,Qwen团队在博客中分享了Qwen3-Coder的部分训练细节。预训练阶段,模型使用了7.5万亿token数据,其中代码占比高达70%,确保了模型在编程方面的卓越表现。后训练阶段,Qwen团队引入了长视距强化学习,鼓励模型通过多轮交互解决现实世界任务,进一步提升了模型的实用性和泛化能力。

Qwen团队表示,他们仍在不断努力提升Coding Agent的性能,旨在让它承担更多复杂和乏味的软件工程任务,从而释放人类的生产力。未来,Qwen3-Coder的更多模型尺寸也将陆续推出,以满足不同用户的需求和场景。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version