阿里巴巴达摩院旗下的通义千问团队近日揭晓了其Qwen3系列模型的新力作——Qwen3-30B-A3B-Instruct-2507。这款非思考模式的开源模型仅需激活3B参数,便能在多项核心能力上媲美Gemini 2.5-Flash(non-thinking)与GPT-4o等闭源巨头,同时在多语言覆盖、用户偏好贴合及长文本处理方面取得了显著进展。该模型已在魔搭社区(ModelScope)与HuggingFace平台上全面开放源代码。
Qwen3-30B-A3B-Instruct-2507作为Qwen3系列的新成员,不仅延续了通义千问团队在架构创新上的卓越表现,更是在大幅降低计算成本的同时,实现了与千亿级闭源模型的性能比肩。据官方数据披露,该模型在数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理及天文学问题解答(GPQA测试得分70.4)、人类偏好贴合(Arena-Hard v2得分69)以及函数调用能力(BFCL-v3得分65.1)等多个关键基准测试中,均展现出强劲实力,部分指标甚至超越了GPT-4o等竞品。
在通用能力方面,Qwen3-30B-A3B-Instruct-2507全面升级了指令遵循、逻辑推理、数学、科学、编程及工具使用等多方面技能。尤其在多语言长尾知识覆盖上取得了显著进步,同时在主观和开放任务中,新模型与用户偏好的贴合度进一步提升,能够生成更高质量的文本,为用户提供更加精准有用的回答。其长文本理解能力也跃升至256K的新高度。
自2023年发布以来,通义千问系列大语言模型已开源超过200个模型,全球下载量突破3亿次大关,衍生模型数量更是超过10万个。此次Qwen3-30B-A3B-Instruct-2507的推出,无疑再次彰显了阿里巴巴达摩院在大语言模型领域的深厚底蕴与创新能力。