ITBear旗下自媒体矩阵:

阿里新推4B小模型Qwen3,性能超GPT-4.1-nano,端侧部署更友好

   时间:2025-08-07 14:42:03 来源:智东西编辑:快讯团队 IP:北京 发表评论无障碍通道
 

近日,通义千问在其技术更新中隆重推出了两款全新的小型AI模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,这两款模型在保持体积小巧的同时,展现出了令人瞩目的性能提升。

据悉,Qwen3-4B系列的新成员在设计上更加注重对复杂场景的适应能力。特别是Qwen3-4B-Thinking-2507,其推理能力几乎可以媲美一些中型模型,这在小型模型中实属罕见。而Qwen3-4B-Instruct-2507则在知识覆盖、逻辑推理、编程技能以及与人类偏好的对齐性等多个方面,全面超越了同类产品GPT-4.1-nano,即便与中等规模的Qwen3-30B-A3B相比也毫不逊色。

这两款新模型不仅在性能上有了显著提升,更重要的是,它们对手机等端侧硬件的友好度大大增强。这意味着,用户将能够在更多场景下,通过轻量级设备享受到AI带来的便利。目前,Qwen3-4B系列模型已经在魔搭社区和Hugging Face平台上正式开源,供开发者们自由使用和探索。

在性能测试方面,Qwen3-4B-Thinking-2507在复杂问题推理、数学运算、代码编写以及多轮函数调用等任务上,均展现出了远超同尺寸模型的能力。而在Arena-Hard v2基准测试中,Qwen3-4B-Instruct-2507更是取得了43.4分的高分,进一步证明了其卓越的性能。

Qwen3-4B-Instruct-2507在知识覆盖面上的表现也尤为突出。它涵盖了更多语言的长尾知识,使得在主观和开放性任务中,其回答能够更加贴近人类的需求和偏好。这种与人类偏好的高度对齐性,无疑将极大地提升用户体验。

Qwen3-4B-Thinking-2507在推理领域的表现同样令人瞩目。在聚焦数学能力的AIME25测评中,它以4B的参数量取得了81.3分的优异成绩,这一成绩甚至可以与一些中型模型相媲美。同时,其通用能力也得到了显著提升,Agent分数甚至超越了更大尺寸的Qwen3-30B-Thinking模型。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version