近日,阿里巴巴旗下的通义千问团队推出了全新的推理模型Qwen3-30B-A3B-Thinking-2507,该模型以其卓越的智慧、敏捷性和全面性引起了业界的广泛关注。目前,这一模型已在魔搭社区和HuggingFace平台上实现开源,供开发者和研究人员免费使用。
与今年4月29日公开的Qwen3-30-A3B模型相比,新版本在多个维度上实现了显著提升。在数学能力方面,Qwen3-30B-A3B-Thinking-2507在AIME25评测中取得了85.0的高分,展现出了强大的数学解题能力。同时,在代码能力测试LiveCodeBench v6中,该模型也获得了66.0的优异成绩,代码编写水平同样不容小觑。这两项核心推理能力的表现均超过了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)等同类模型。
除了在数学和代码方面的卓越表现外,Qwen3-30B-A3B-Thinking-2507在通用能力上也实现了全面升级。在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等评测中,该模型均展现出了出色的表现,超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)等竞争对手。这标志着Qwen3-30B-A3B-Thinking-2507在理解和处理复杂情境、进行高效沟通方面迈上了新的台阶。
Qwen3-30B-A3B-Thinking-2507在上下文理解方面也取得了重大突破。该模型原生支持256K tokens的上下文长度,并且可扩展至1M tokens,这为用户提供了更广阔的信息处理空间。在处理长文本或复杂对话时,该模型能够更准确地捕捉上下文信息,从而做出更合理的推断和回应。
Qwen3-30B-A3B-Thinking-2507的思考长度也有所增加。这意味着在处理高度复杂的推理任务时,用户可以为该模型设置更长的思考预算,以充分发挥其潜力。这一改进使得Qwen3-30B-A3B-Thinking-2507在处理复杂问题时更加从容不迫,能够给出更加深入和全面的答案。
随着Qwen3-30B-A3B-Thinking-2507的推出,阿里巴巴通义千问团队再次展示了其在人工智能领域的深厚实力和创新能力。这一新模型的推出将为开发者和研究人员提供更多的选择和可能性,推动人工智能技术在各个领域的应用和发展。