ITBear旗下自媒体矩阵:

阿里Qwen3-Coder编程模型震撼开源:480B参数,智能体编程能力超越Kimi K2

   时间:2025-07-24 05:58:17 来源:智东西编辑:快讯团队 IP:北京 发表评论无障碍通道
 

阿里巴巴Qwen团队近期宣布了一项重大进展,正式开源了其最新的旗舰编程模型——Qwen3-Coder-480B-A35B-Instruct。这一模型的问世,标志着Qwen团队在智能体编程领域迈出了坚实的一步。

Qwen3-Coder以其庞大的4800亿参数规模,以及350亿激活参数,成为了Qwen团队迄今为止最为强大的开源智能体编程模型。它不仅原生支持256K的上下文长度,还能通过外推技术扩展至100万的上下文输入,最大输出更是达到了6.5万token,性能表现令人瞩目。

在基准测试中,Qwen3-Coder展现出了卓越的编程和智能体任务处理能力。它在Agentic Coding(智能体编程)、Agentic Browser-Use(智能体浏览器使用)和Agentic Tool-Use(智能体工具调用)三类任务中,均取得了开源领域的顶尖成绩,甚至超越了Kimi K2、DeepSeek V3等开源模型,以及GPT-4.1等闭源模型,与以编程能力见长的Claude Sonnet 4模型不相上下。

Qwen3-Coder的参数规模超过了阿里旗舰模型Qwen3的2350亿参数,但相较于Kimi K2的1万亿参数仍有所不及。然而,在实际应用中,Qwen3-Coder却展现出了惊人的效率。据阿里官方介绍,借助这一模型,新手程序员一天就能完成资深程序员一周的工作量,生成一个品牌官网最快仅需5分钟。

除了强大的模型本身,Qwen团队还开源了一个智能体编程命令行工具——Qwen Code。这一工具基于Gemini Code进行分叉和定制,通过适配提示和函数调用协议,能够更充分地释放Qwen3-Coder在智能体编程任务上的潜力。

目前,Qwen3-Coder模型已在阿里云旗下的大模型服务平台百炼上线,其API采用了阶梯计费方式,根据输入token量调整价格。在256K至1M的输入范围内,其价格为6美元/百万token(输入)和60美元/百万token(输出)。相比之下,Claude Sonnet 4的输入输出价格分别为3美元/百万token和15美元/百万token。

Qwen3-Coder还已在Qwen Chat网页版上线,供用户免费体验。其480B版本也已在Hugging Face、魔搭等开源社区发布,可供开发者下载和本地部署。Qwen团队还在一篇博客文章中详细分享了模型的技术细节,为开发者提供了宝贵的参考。

在Qwen3-Coder发布前,这一模型已经悄然在Qwen Chat官网上线,引发了海外网友的热烈关注和实测。海外网友们纷纷贡献了一批实测案例,展示了Qwen3-Coder在指令遵循、UI设计、动画等方面的惊人能力。例如,有网友让Qwen3-Coder打造一个Wordle单词游戏,结果游戏页面和源代码一次性通过测试,无需推理。

在技术博客中,Qwen团队分享了Qwen3-Coder的部分训练细节。预训练阶段,该模型使用了7.5万亿token的数据,其中代码占比高达70%,因此模型在编程方面表现出色,同时保留了通用和数学能力。后训练阶段,Qwen团队引入了长视距强化学习,鼓励模型通过多轮交互解决现实世界任务。为此,团队构建了一个能够并行运行20000个独立环境的可扩展系统,为大规模强化学习提供了必要的反馈和支持。

Qwen3-Coder的开源,无疑给国内开发者提供了新的选择和机遇。在Cursor断供Claude等适用于编程领域的模型之际,Qwen3-Coder的及时出现,无疑为开发者们注入了一剂强心针。未来,随着更多模型尺寸的推出和技术的不断迭代,Qwen3-Coder有望在智能体编程领域发挥更加重要的作用。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version