ITBear旗下自媒体矩阵:

多模态视觉大模型12月战报:Gemini 霸榜,豆包、商汤领跑国产阵营

   时间:2025-12-31 16:32:58 来源:CHINAZ编辑:快讯 IP:北京 发表评论无障碍通道
 

在刚刚公布的 SuperCLUE-VLM12月多模态视觉语言基准测评中,全球 AI 大模型展现出了极强的竞争态势。本次测评从基础认知、视觉推理以及视觉应用三个核心维度展开,全方位考察了各大模型的“眼力”与“脑力”。

在此次角逐中,谷歌推出的Gemini-3-pro以83.64分的绝对优势摘得桂冠。详细数据显示,其在三项细分指标上均实现了全面领先,展现了国际顶尖模型的深厚底蕴。而在国产模型方面,整体表现同样亮眼。商汤科技的 SenseNova V6.5Pro 以75.35分紧随其后位居次席,字节跳动旗下的豆包视觉版则以73.15分成功闯入前三。值得一提的是,豆包在基础认知方面的表现甚至超越了部分国际强敌。

百度 ERNIE-5.0-Preview 与阿里巴巴的 Qwen3-vl 也成功进入榜单前五。其中,Qwen3-vl 更是成为榜单中首个总分突破70分大关的开源模型,为开源社区贡献了极强的视觉解析能力。

相比之下,部分国际老牌劲旅的表现略显乏力。Anthropic 的 Claude-opus-4-5获得71.44分,而 OpenAI 的 GPT-5.2(high) 则意外跌出第一梯队,仅以69.16分排名靠后。这一排名的变动,也标志着多模态 AI 领域的竞争正进入白热化的阶段。

划重点:

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version