ITBear旗下自媒体矩阵:

中文大模型SuperCLUE测评揭晓:豆包追赶海外顶尖 小米两款模型入榜国产开源亮眼

   时间:2026-03-30 20:12:34 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在最新发布的中文大模型基准测评SuperCLUE中,22款国内外主流模型展开激烈比拼。此次测评涵盖数学推理、科学推理、代码生成等六大核心任务,对模型综合能力进行全方位检验。海外闭源模型在总分排名上依旧占据优势,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)以及OpenAI的GPT-5.4(xhigh)分别位列前三名。

字节跳动旗下的豆包(Doubao-Seed-2.0-pro-260215(high))表现抢眼,以71.53分的成绩夺得国内第一,成功跻身全球第一梯队。该模型总分与排名第三的GPT-5.4仅相差0.95分,在智能体任务规划维度更是超越部分海外模型,位列全球前五,展现出强劲的追赶势头。

小米集团在此次测评中也有亮眼表现,其MiMo-V2系列的两款模型均成功上榜。其中,MiMo-V2-Pro以60.67分的成绩在闭源模型中名列前茅,尤其在数学推理任务中取得84.03分的高分;另一款开源版本MiMo-V2-Flash虽然总分49.97分排名相对靠后,但在代码生成等细分场景中展现出一定潜力。

国产模型在此次测评中整体表现突出,特别是在开源赛道上优势明显。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽了开源榜前三名,与海外同类模型相比具有显著领先优势。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version