近期,Qwen系列模型迎来了重大更新,Qwen3-30B-A3B-Instruct-2507版本正式面世。这一新版本在非思考模式下,仅凭激活3B参数,便展现出了与Gemini2.5-Flash(非思考版)、GPT-4o等顶尖闭源模型相当的性能,标志着Qwen模型在技术上取得了显著突破。
Qwen3-30B-A3B-Instruct-2507在通用能力上的提升尤为显著。无论是指令遵循、逻辑推理、文本理解,还是数学、科学、编程及工具使用等领域,该模型都展现出了卓越的多功能性。这种全面的提升,不仅让模型在处理复杂任务时更加智能高效,也大大拓展了其应用场景。
新版本模型在多语言长尾知识覆盖方面也取得了长足进步。它能够更好地理解和生成多种语言的文本,这对于全球化的应用场景而言,无疑是一个巨大的加分项。这一改进,使得Qwen3-30B-A3B-Instruct-2507在跨文化交流中更加游刃有余。
在主观和开放性任务的处理上,新模型也展现出了与用户偏好的高度对齐。它能够生成更高质量的文本,为用户提供更加贴心、有用的回答。这种与用户需求的紧密贴合,让模型在与用户的交互中更加自然流畅,提升了用户体验。
新模型的长文本理解能力也得到了显著提升,达到了256K的级别。这一改进,极大地增强了模型的上下文理解能力,使其能够轻松应对更长的文本输入,从而更准确地理解和生成复杂的文本内容。
为了让更多开发者和研究人员能够方便地体验这一新模型,Qwen团队已经将其在魔搭社区和HuggingFace等平台开源。同时,团队还诚邀用户前往QwenChat(chat.qwen.ai)直接感受新版本的强大功能。这一举措不仅彰显了团队对模型性能的自信,也为用户提供了宝贵的体验和反馈机会,有助于模型后续的进一步优化和改进。