通义千问团队近日宣布推出全新大模型Qwen3-Max,该模型被定义为团队迄今为止规模最大、性能最强的语言模型。据技术文档披露,Qwen3-Max的总参数量突破1万亿,预训练阶段消耗了36万亿个token的数据量,其架构延续了Qwen3系列的设计范式,并引入了团队自主研发的global-batch负载均衡损失函数。
在权威评测平台LMArena的文本生成榜单中,Qwen3-Max-Instruct的预览版本已跻身全球前三,性能表现超越同期版本的GPT-5-Chat。最新发布的正式版本通过架构优化,在代码生成、智能体交互等专项能力上实现显著提升,在涵盖知识储备、逻辑推理、编程实现、指令响应、价值观对齐、多任务代理及跨语言理解等维度的综合评测中,均达到行业领先水准。
专项测试数据显示,该模型在现实编程场景下的表现尤为突出。在针对软件工程实际问题的SWE-Bench Verified评测中,Qwen3-Max-Instruct以69.6分的成绩稳居全球顶级模型行列。研发团队特别强调,正式版本通过增强代码解释器与并行测试时计算技术的融合,使模型在复杂系统开发中的代码生成准确性和效率得到质的提升。
值得关注的是,团队同步推出的推理增强版Qwen3-Max-Thinking展现了突破性的数学推理能力。在AIME 25和HMMT两项国际数学竞赛级基准测试中,该版本均取得满分成绩,标志着模型在符号计算、定理推导等高阶认知领域的突破。技术白皮书指出,这种性能跃升得益于代码解释器与多路径推理机制的深度整合。
据开发团队介绍,Qwen3-Max系列模型在训练阶段就特别注重多模态能力的协同发展。通过创新的数据混合策略,模型在保持文本处理优势的同时,显著提升了在结构化数据解析、多语言混合语境理解等场景下的适应能力。目前,该系列模型已开放商业应用接口,开发者可通过指定渠道获取技术文档与开发套件。
行业分析师指出,Qwen3-Max的发布标志着国产大模型在万亿参数赛道实现重要突破。其独特的损失函数设计和推理架构创新,为解决超大规模模型训练中的梯度消失问题提供了新思路。随着正式版本的全面上线,预计将在智能客服、代码开发、科研计算等领域引发新一轮应用变革。
获取更多人工智能领域前沿资讯,可访问专业信息平台:http://www.aipress.com.cn/,实时追踪全球AI技术发展动态。