近日,通义千问在其技术更新中隆重推出了两款全新的小型AI模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,这两款模型在保持体积小巧的同时,展现出了令人瞩目的性能提升。
据悉,Qwen3-4B系列的新成员在设计上更加注重对复杂场景的适应能力。特别是Qwen3-4B-Thinking-2507,其推理能力几乎可以媲美一些中型模型,这在小型模型中实属罕见。而Qwen3-4B-Instruct-2507则在知识覆盖、逻辑推理、编程技能以及与人类偏好的对齐性等多个方面,全面超越了同类产品GPT-4.1-nano,即便与中等规模的Qwen3-30B-A3B相比也毫不逊色。
这两款新模型不仅在性能上有了显著提升,更重要的是,它们对手机等端侧硬件的友好度大大增强。这意味着,用户将能够在更多场景下,通过轻量级设备享受到AI带来的便利。目前,Qwen3-4B系列模型已经在魔搭社区和Hugging Face平台上正式开源,供开发者们自由使用和探索。
在性能测试方面,Qwen3-4B-Thinking-2507在复杂问题推理、数学运算、代码编写以及多轮函数调用等任务上,均展现出了远超同尺寸模型的能力。而在Arena-Hard v2基准测试中,Qwen3-4B-Instruct-2507更是取得了43.4分的高分,进一步证明了其卓越的性能。
Qwen3-4B-Instruct-2507在知识覆盖面上的表现也尤为突出。它涵盖了更多语言的长尾知识,使得在主观和开放性任务中,其回答能够更加贴近人类的需求和偏好。这种与人类偏好的高度对齐性,无疑将极大地提升用户体验。
Qwen3-4B-Thinking-2507在推理领域的表现同样令人瞩目。在聚焦数学能力的AIME25测评中,它以4B的参数量取得了81.3分的优异成绩,这一成绩甚至可以与一些中型模型相媲美。同时,其通用能力也得到了显著提升,Agent分数甚至超越了更大尺寸的Qwen3-30B-Thinking模型。