滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

多模态视觉测评12月揭榜：Gemini-3-pro登顶，国产豆包商汤强势突围

时间：2025-12-31 14:44:52 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在最新发布的多模态视觉语言基准测评SuperCLUE-VLM中，全球顶尖人工智能模型展开了一场激烈较量。这场以“视觉理解与语言交互”为核心的评测，从基础认知能力、复杂视觉推理及实际应用场景三个维度，全面检验了各大模型的综合实力。

谷歌旗下Gemini-3-pro以83.64分的总成绩登顶榜首，其优势体现在评测体系的所有细分领域。该模型不仅在基础图像识别任务中展现精准判断力，更在需要逻辑推理的视觉问题解答环节表现突出，实际应用场景中的多模态交互能力同样领先。这种全方位的技术突破，印证了国际头部企业在视觉语言模型领域的持续创新力。

中国科技企业在此次评测中形成强劲的第二梯队。商汤科技SenseNova V6.5Pro以75.35分紧随其后，字节跳动豆包视觉版则以73.15分跻身三甲。特别值得注意的是，豆包模型在基础认知模块的得分超越多个国际竞争对手，显示出国产模型在特定技术维度的突破性进展。百度ERNIE-5.0-Preview与阿里Qwen3-vl分别以72.89分和71.23分位列第四、五名，其中Qwen3-vl作为开源模型首次突破70分大关，为全球开发者社区提供了重要的技术参考。

传统国际大厂的表现出现明显分化。Anthropic的Claude-opus-4-5获得71.44分勉强保住前五位置，而OpenAI的GPT-5.2（high）仅取得69.16分，跌出第一梯队。这种排名变化反映出多模态技术竞争格局的深刻调整——曾经在语言模型领域占据绝对优势的企业，在视觉语言融合的新赛道上面临严峻挑战。

技术亮点方面，开源模型的表现引发行业关注。Qwen3-vl不仅实现总分突破，其视觉解析模块的开源代码已被全球开发者下载超过30万次，衍生出200余个改进版本。这种技术扩散效应正在重塑AI生态，使得中小研发团队也能基于先进架构进行二次创新。相比之下，部分闭源模型虽然保持技术领先，但在生态影响力构建上显现出滞后态势。

评测数据还揭示了行业技术演进方向：基础认知模块的平均得分较去年提升17%，但视觉推理模块的得分差距扩大至23个百分点。这表明简单图像识别技术已趋成熟，而涉及空间关系、因果推断等复杂认知任务仍是技术攻坚重点。实际应用场景测试中，医疗影像分析、工业缺陷检测等垂直领域的需求，正在推动模型向专业化方向分化。

更多>同类资讯

传音Tecno Pop X 5G新机4月20日发布，大电池快充防尘防水亮点多

04-17

《使命召唤：战争地带手游》明日停服虚拟货币失效且无退款

04-17

7大电商平台被罚没详情：拼多多15.22亿，美团7.46亿，阿里系累计6.3亿

4月17日消息，市场监管总局依法对拼多多、美团、京东、淘宝闪购、抖音、淘宝、天猫等7家电商平台幽灵外卖系列案，依据《中华人民共和国食品安全法》第一百三十一条、《中华人民共和国电子商务法》第八十三条的规定作出行政处罚决定，责令7家电商平台改正违法行为，暂停

04-17

字节Seedance 2.0论文亮相：170人团队署名，吴永辉曾妍领衔，技术突破引关注

现象级AI视频技术、字节 Seedance 2.0在arXiv发论文了。其中稳定不变的核心人物可以找到吴永辉，现任字节跳动Seed团队基础研究负责人，是Seedance系列视频生成模型的最高技术决策者，直…

04-17

日均百亿Token消耗成双刃剑字节AI从“烧钱扩张”转向“降本求生”

为了降低算力和研发成本，或者将算力移到更有付费能力的产品上，豆包可能缩减了模型训练的投入，导致生成内容的质量下滑——比如减少了数据训练量，优化算法的频率降低，甚至简化了交互逻辑，使得AI生成的内容越来越“模…

04-17

SpaceX或6月上市在即谷歌持股有望随其IPO斩获超千亿美元收益

04-17

小红书全资控股新公司红擎创落户上海注册资本达百万聚焦咨询服务领域

04-17

AI自主支付时代来临！戒熬夜Skill走红，ClawTip赋能AI“边干活边赚钱”

04-17

字节Seedance 2.0论文发布：170人团队亮相，吴永辉曾妍领衔，薪资潜力引关注

04-17

具身智能数据赛道升温，智元觅蜂科技携手多方共筑数据新生态

04-17

字节数分Pai离职王迪接任；小红书问一问夺冠；拼多多五一休满；狗东物流调整

04-17

雷军谈被贴“营销大师”标签：实为抹黑，曾因误解不愿直播现决心澄清事实

雷军在直播中介绍，他曾被贴上了“营销大师”的标签，“被贴上这个标签，其实他们这里是有阴谋诡计的，因为他们希望让大家觉得小米的车不是产品好，不是质量好，是因为小米营销好，他们表面上在夸我，实际上在黑我，所以去…

04-17

雷军15小时直播实测小米SU7续航回应质疑：站出来让大众更了解小米

直播中途，当雷军在副驾驶位看到网友留言“太拼了”，他笑着回应：“我这不是太拼了，是被逼的！”雷军坦言：“因为我去年说了一句‘只充一次电’，遭遇了太多质疑。同时雷军表示，“去年年初我曾说过，开YU7标准版…

04-17

雷军直播谈油价飙升：开电车每月省千元维护费，分期购车更划算

谈到今天这次直播的压力，雷军说：“最大的心理负担是不能说错话。一说错话可能又会被黑子抓住拼命黑。”雷军还表示，过去一年小米长时间被负面舆情所笼罩，在这种压力下如果因为害怕被黑就不站出来讲，可能会让一般人产生更…

04-17

OpenAI 推生命科学 AI 模型 GPT-Rosalind 加速药物研发引行业关注

04-17

点击查看更多 +

全站最新

字节Seedance 2.0论文亮相：170人团队署名，吴永辉曾妍领衔，技术突破引关注

2026华南峰会落幕：2000+精英共探智造光储充电源电感变压器新未来

日均百亿Token消耗成双刃剑字节AI从“烧钱扩张”转向“降本求生”

港股创新药概念股集体回调，药明合联跌超5%

北证50拉升涨近4%

北证50拉升涨超4%

热门内容

本栏最新

字节Seedance 2.0论文亮相：170人团队署名，吴永辉曾妍领衔，技术突破引关注

日均百亿Token消耗成双刃剑字节AI从“烧钱扩张”转向“降本求生”

雷军谈被贴“营销大师”标签：实为抹黑，曾因误解不愿直播现决心澄清事实

雷军15小时直播实测小米SU7续航回应质疑：站出来让大众更了解小米

雷军直播谈油价飙升：开电车每月省千元维护费，分期购车更划算

京东携手深蓝汽车，国民好车2.0深蓝L06增程版重庆正式下线

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.