ITBear旗下自媒体矩阵:

多模态视觉语言测评:Gemini-3-pro登顶 国内多款大模型表现亮眼

   时间:2025-12-31 11:44:30 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,SuperCLUE-VLM多模态视觉语言基准测评12月榜单正式揭晓,全球顶尖模型展开了一场激烈的技术较量。谷歌推出的Gemini-3-pro以83.64分的绝对优势登顶榜首,在基础认知、视觉推理、视觉应用三个核心维度均展现出统治力,三项细分指标分别达到89.01、82.82和79.09分,成为唯一三项均突破80分的模型。

国内科技企业在此次测评中表现亮眼,形成与国际巨头分庭抗礼的格局。商汤科技SenseNova V6.5 Pro以75.35分位居国内榜首、全球第二,其综合实力紧追国际领先水平。字节跳动旗下两款模型同时闯入前三,其中豆包大模型以73.15分位列全球第三,豆包视觉版虽在视觉推理环节稍逊一筹,但基础认知得分高达82.70分,甚至超越部分国际竞品,展现出强大的技术潜力。

百度ERNIE-5.0-Preview与阿里巴巴Qwen3-vl分列第四、五位,共同构成国内模型的第一梯队。值得注意的是,Qwen3-vl作为榜单中首个开源且总分突破70分的模型,为行业提供了重要的技术参考,其开放策略或将推动多模态技术的普及与发展。

国际阵营中,头部企业表现出现分化。Anthropic的Claude-opus-4-5以71.44分位列第六,而OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。这一结果反映出多模态领域竞争格局的深刻变化,国内企业通过持续技术创新,正在缩小与国际顶尖水平的差距。

本次测评采用三维评估体系,全面考察模型在复杂场景下的理解与生成能力。基础认知维度侧重语言与视觉信息的基础处理,视觉推理考察逻辑分析能力,视觉应用则关注实际场景中的任务解决能力。这种多维度的评估方式,为行业提供了更具参考价值的技术标尺。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version