阿里云再度引发AI领域震动——其最新推出的Qwen3-Max-Preview(Instruct)大模型以超万亿参数规模打破行业纪录,在多项国际权威评测中力压群雄,成为非推理类模型中的绝对标杆。
在知识推理、数学计算、编程能力等五大核心维度上,该模型展现了碾压式优势。SuperGPQA评测中,Qwen3-Max-Preview以64.6分登顶知识推理榜首;AIME25数学评测中,80.6分的成绩较第二名高出12个百分点;LiveCodeBench V6编程评测中,57.5分的表现同样领先同类模型。尤为瞩目的是,该模型在Arena-Hard v2复杂问题解决评测中斩获86.1分,较自家Qwen3-235B-A22B-Instruct-2507提升近20个百分点。
技术突破背后是参数规模的指数级增长。阿里云研发团队证实,Qwen3-Max-Preview通过Scaling Law(缩放定律)实现了性能跃迁,万亿级参数带来的知识容量提升,使其在多语言支持、任务泛化能力上实现质变。模型现已支持100余种语言交互,特别针对RAG检索增强生成、工具调用等企业级场景进行专项优化。
实测环节中,该模型在物理模拟、图形生成等跨领域任务中表现惊艳。牙医领域开发者karminski的测试显示,在流体动力学模拟中,Qwen3-Max-Preview准确呈现了液体倾倒的物理轨迹,而Gemini 2.5和DeepSeek-V3.1均出现明显错误。更令人称道的是,该模型能一键生成符合物理规律的SVG动画,并支持将单张照片转化为像素风格艺术作品。
商业化层面,阿里云百炼平台已同步开放API调用服务。用户可根据处理token数量选择阶梯计费方案:32k以下输入0.006元/千token,输出0.024元/千token;128k-252k区间输入费用提升至0.015元/千token。平台最高支持256k上下文窗口,满足长文本处理需求。同时,Qwen Chat应用也完成模型升级,所有用户可免费体验新功能。
行业分析师指出,Qwen3-Max-Preview的推出标志着中国AI企业在基础模型领域进入全球第一梯队。其通过扩大参数规模持续提升性能的技术路径,为行业提供了Scaling Law仍具生命力的实证案例。随着企业级应用场景的深度适配,该模型有望在智能客服、科研计算、内容创作等领域引发新一轮变革。