ITBear旗下自媒体矩阵:

阿里巴巴推出Qwen3-Coder编程模型,挑战编程AI领域新高度

   时间:2025-07-25 03:35:23 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

中国电商巨头阿里巴巴旗下的AI研发团队“通义千问”近日再度传来捷报,其最新推出的开源大语言模型Qwen3-Coder-480B-A35B-Instruct,在软件开发领域掀起波澜。

就在不久前,通义千问团队刚刚发布了Qwen3-235B-A22B-2507模型,该模型凭借卓越表现,一举成为全球顶尖的非推理大语言模型,甚至与谷歌、OpenAI等科技巨头的专有AI模型相媲美。此番,Qwen3-Coder的问世,再次彰显了通义千问在AI领域的深厚底蕴。

Qwen3-Coder专为软件开发设计,旨在协助开发者高效完成复杂的多步骤编程任务。该模型能够在极短时间内,快速构建出功能完备的应用程序,极大提升了开发效率。

在智能体编程任务中,Qwen3-Coder与Claude Sonnet-4等专有产品展开激烈竞争,并在开源模型中刷新了基准分数。其强大的性能,赢得了业界的广泛关注与赞誉。

目前,Qwen3-Coder已在Hugging Face、GitHub、通义千问聊天平台、阿里巴巴通义千问API以及众多第三方编程和AI工具平台上架。开源许可的发布,意味着任何企业或个人均可免费获取、修改、部署该模型,无需支付任何额外费用。

这一举措,不仅降低了企业的成本,还提供了更多的选择性。与Claude等专有模型相比,Qwen3-Coder的开源策略无疑更具吸引力。

在第三方基准测试中,Qwen3-Coder表现出色,尤其在AI高级用户中进行“感知编程”时,体验尤为良好。有专家指出,该模型或已成为迄今为止最好的编程模型之一,其通用性与专业性并重,为用户带来了前所未有的便捷与高效。

对于有兴趣下载的开发者和企业而言,只需前往Hugging Face等AI代码共享仓库,即可轻松获取Qwen3-Coder的代码。同时,阿里云通义千问API也提供了直接使用该模型的服务,用户可根据实际需求选择不同的Token套餐,享受灵活的计费方式。

Qwen3-Coder采用专家混合(MoE)模型架构,总参数高达4800亿,每次查询可激活350亿参数,在160个专家中激活8个。该模型原生支持256K Token上下文长度,并可通过YaRN技术外推至100万Token,使其能够在单次处理中理解和操作整个代码仓库或冗长文档。

在智能体评估套件中,Qwen3-Coder在开源模型中取得了领先性能。同时,在智能体浏览器使用、多语言编程和工具使用等任务中也表现出色。视觉基准显示,该模型在代码生成、SQL编程、代码编辑和指令跟随等类别中,均呈现出渐进式改进。

通义千问还开源了Qwen Code这一CLI工具,支持函数调用和结构化提示,使Qwen3-Coder更易集成到编程工作流程中。同时,Qwen3-Coder还与多个开发者平台实现集成,为用户提供了丰富的选择和便捷的体验。

除了预训练外,Qwen3-Coder还受益于先进的后训练技术,包括代码强化学习和长期智能体强化学习。这些技术使模型能够在多样化、可验证的代码任务上进行高质量、执行驱动的学习,并在多轮交互中进行规划、使用工具和适应。

对于企业而言,Qwen3-Coder提供了封闭源码专有模型的开放、高能力替代方案。其强大的编程执行和长上下文推理能力,特别适用于代码库级理解、自动化拉取请求工作流程、工具集成和编排等场景。同时,作为开源模型,企业可以在自己的基础设施上部署Qwen3-Coder,避免供应商锁定并更直接地管理计算使用。

在开发者社区中,Qwen3-Coder同样赢得了广泛好评。多位AI研究员、工程师和开发者在测试该模型后,纷纷表示其性能卓越,甚至在某些方面超越了现有专有模型。一位开发者在分享其将Qwen3-Coder与Claude Code集成的经验时表示:“这肯定是目前最好的一个。”

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version