ITBear旗下自媒体矩阵:

商汤日日新V6.5在SuperCLUE测评中登顶国内多模态大模型榜首

   时间:2025-12-31 17:29:45 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在最新发布的《中文多模态视觉语言模型测评基准12月报告》中,商汤科技自主研发的日日新V6.5(SenseNova V6.5 Pro)模型以显著优势登顶国内榜单。该模型以75.35分的综合成绩摘得金牌,在视觉推理专项维度更以突破性表现刷新国内纪录,成为本次评测中唯一突破75分大关的国产模型。

据SuperCLUE评测机构披露,此次评估涵盖视觉理解、语言交互、逻辑推理等六大核心维度,共有23个国内外主流模型参与角逐。商汤日日新V6.5在视觉推理子项中展现出卓越性能,其得分较第二名高出4.2个百分点,在复杂场景理解、空间关系推演等任务中表现尤为突出。评测报告特别指出,该模型在处理多物体交互、动态场景识别等高难度任务时,展现出接近人类水平的认知能力。

与同期参评的Doubao-seed-1.6-vision、ERNIE-5.0、Qwen3等模型相比,商汤方案在多模态信息融合方面形成技术代差。其独创的动态注意力机制与三维语义编码架构,有效解决了传统模型在处理复杂视觉语言任务时的信息丢失问题。测试数据显示,在涉及多轮对话的视觉问答场景中,日日新V6.5的准确率较行业平均水平提升18.7%。

商汤科技研发团队透露,此次突破源于持续三年的技术攻坚。通过构建全球最大的中文多模态训练数据集,结合自研的异构计算架构,模型在保持低延迟的同时实现了参数效率的显著优化。目前该技术已应用于智能医疗、自动驾驶、工业检测等多个领域,在某三甲医院的影像诊断场景中,辅助诊断准确率达到专家级水平。

行业分析师指出,随着多模态大模型进入深度应用阶段,视觉推理能力正成为区分模型竞争力的核心指标。商汤此次登顶不仅证明其在算法创新方面的领先地位,更为中文大模型在专业领域的垂直落地提供了重要范式。据悉,相关技术成果已形成37项国际专利,并被纳入IEEE多模态交互标准参考架构。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version