ITBear旗下自媒体矩阵:

阿里通义千问发布Qwen3-Coder代码模型,开源性能直追Claude Sonnet 4

   时间:2025-07-23 20:37:36 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

阿里通义千问近期发布了一项重大技术成果——Qwen3-Coder,这款代码模型被誉为迄今为止最具代理能力的产品,并已向全球开发者开源。这一举措标志着阿里在AI编程领域的又一重大突破。

Qwen3-Coder提供多种版本,其中最强大的版本为Qwen3-Coder-480B-A35B-Instruct。这款MoE模型结合了480B的基础参数和35B的激活参数,支持高达256K token的上下文长度,并可通过YaRN技术扩展至1M token。其卓越的代码生成能力和Agent特性尤为突出。

据透露,Qwen3-Coder-480B-A35B-Instruct在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use方面取得了开源模型的顶尖表现,与业界知名的Claude Sonnet4模型不相上下。这一成就进一步巩固了Qwen3-Coder在AI编程助手领域的领先地位。

为了帮助开发者更好地利用Qwen3-Coder,通义团队还推出了Qwen Code命令行工具。该工具基于Gemini Code进行了优化,调整了prompt和工具调用协议,旨在最大限度地提升Qwen3-Coder在Agentic Coding任务中的表现。Qwen3-Coder的API还与Claude Code、Cline等工具实现了无缝协同。

目前,Qwen3-Coder已在多个平台如魔搭社区和HuggingFace上开源,全球开发者均可免费下载和使用。同时,该模型即将集成到阿里的AI编程产品通义灵码中,其API也已在阿里云百炼平台上上线。

回顾今年5月,Anthropic公司发布的Claude 4双模型——Claude Opus 4和Claude Sonnet 4,以“不间断编码7小时”为卖点,展示了其强大的编码和推理能力。Claude Code编程助手也随之全面开放。在权威编程基准测试SWE-bench Verified中,Claude Opus 4和Claude Sonnet 4分别取得了79.4%和80.2%的高分,远超OpenAI Codex-1、o3、GPT-4.1以及Gemini 2.5 Pro等模型。

面对如此强劲的竞争对手,通义团队表示,Qwen3-Coder的升级从多个维度进行了优化,以提升代码能力。数据方面,模型训练使用了总计7.5T的数据,其中70%为代码数据,确保了模型在保持通用与数学能力的同时,拥有出色的编程能力。上下文方面,原生支持256K token长度,并通过YaRN技术扩展至1M,专为仓库级和动态数据处理优化。还通过Qwen2.5-Coder对低质数据进行清洗与重写,显著提升了数据质量。

在真实世界的软件工程任务中,如SWE-Bench测试,通义团队在Qwen3-Coder的后训练阶段实施了Agent RL策略,鼓励模型通过多轮交互利用工具解决问题。借助阿里云的基础设施,实现了同时运行20k个独立环境的能力。这一基础设施为模型提供了大规模的强化学习反馈和评测,助力Qwen3-Coder在SWE-bench Verified测试中取得了开源模型的顶尖成绩。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version