ITBear旗下自媒体矩阵:

阿里通义千问升级推理模型,Qwen3-30B-A3B-Thinking-2507能力大幅提升并开源

   时间:2025-07-31 15:33:52 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

阿里通义千问近期宣布了一项重大进展,正式推出了其最新的推理模型Qwen3-30B-A3B-Thinking-2507。相较于今年4月推出的Qwen3-30-A3B模型,新版本在多个关键领域实现了显著提升。

在数学推理方面,Qwen3-30B-A3B-Thinking-2507在AIME25评测中取得了85.0的高分,这一成绩彰显了其强大的数学解题能力。同时,在代码能力测试LiveCodeBench v6中,该模型也获得了66.0的分数,两项核心推理能力均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。

新模型在知识水平方面也取得了显著进步。在GPQA和MMLU-Pro等评测中,Qwen3-30B-A3B-Thinking-2507的表现均优于其前身。这意味着它在处理广泛的知识性问题时,能够提供更准确、更全面的答案。

除了推理能力和知识水平外,Qwen3-30B-A3B-Thinking-2507在通用能力方面也表现出色。在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等评测中,该模型均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。这些结果表明,新模型在处理复杂、多变的场景时,能够展现出更高的灵活性和适应性。

Qwen3-30B-A3B-Thinking-2507还支持更长的上下文理解。它原生支持256K tokens,并可扩展至1M tokens,这在处理大型文本或复杂对话时尤为重要。新模型的思考长度也有所增加,官方建议在处理高度复杂的推理任务时,设置更长的思考预算以充分发挥其潜力。

目前,Qwen3-30B-A3B-Thinking-2507已在魔搭社区和HuggingFace上开源,其轻量级的设计使得消费级硬件也能轻松实现本地部署。同时,该模型也在Qwen Chat上同步上线,用户可以直接体验其强大的推理和通用能力。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version