5月8日消息,继今年早些时候发布全球首个面向信贷场景的多模态评测基准FCMBench-V1.0与V1.1后,奇富科技近日再推重磅成果,正式发布信贷场景专属的视频评测任务FCMBench-Video-V1.0,旨在通过视频任务推动信贷AI评测从“看懂一张图”进阶到“理解一段过程”。这为信贷场景中的视频理解能力提供了一把可量化的新标尺,标志着AI评测从“静态识别”向“动态研判”迈出了关键一步。
一张精心PS的证件照可能骗过静态审核系统,但一段手持拍摄的连续视频却会“泄密”:人物动作的连贯性、光照变化的连续性、对焦漂移的过程,乃至纸张翻页时的物理褶皱,这些天然携带的真实性信息极难被完美伪造。
FCMBench-Video正是锚定这一特性,将多模态大模型的评测,从二维图像推向了三维时空。
如果说FCMBench解决的是“模型能否读懂静态证照”的问题,那么FCMBench-Video关注的则是更具挑战性的能力边界。视频带来的不仅是更多画面,而是时间维度的引入,以及信息在时间轴上的组织方式。模型不仅需要识别内容,还需要理解这些内容在何时出现、是否重复出现、是否与前后信息一致,以及在复杂干扰下是否仍能保持稳定判断。这些能力直接关系到反欺诈链条中的关键环节,也是传统评测体系难以覆盖的盲区。
举个例子。一段视频里同一个证件反复出现,模型得学会“去重”,不能数一次就算一次;连续出现好几份文件,模型得会“对账”,比一比它们之间有没有矛盾;如果出了风险,模型还得能说出“我是根据第几秒的画面下的判断”。这些不再是简单的识别,而是考验记忆、推理和判断的综合题。
从整体评测结果来看,当前主流视频多模态模型之间仍存在较大能力差距,即使是表现最优的模型,在部分关键任务上也未达到可以直接应用于生产环境的水平。这意味着,视频理解能力在信贷场景中的落地仍处于早期阶段,更印证了FCMBench-Video具备极强的能力区分度,能精准衡量模型的真实水平与提升空间,为企业技术选型、科研机构研究提供权威参考。
作为FCMBench评测基准的重要组成部分,FCMBench-Video延续开放共享理念,配套数据集与工具已同步开源开放,旨在汇聚更多科研工作者及行业机构参与信贷AI能力建设,为信贷AI技术落地实际应用搭建坚实桥梁。
需要说明的是,当前版本的FCMBench-Video所覆盖的文档视频分析,仅为信贷场景视频分析任务的细分维度之一。本次任务设计,提炼自奇富科技当前迭代打磨中的视频尽调AI产品。AI视频尽调不仅要求模型具备准确的文档内容理解能力,更需要对企业经营现场开展全方位综合研判,涵盖厂房环境、生产设备、原料库存、工艺流程、人员作业状态等关键维度,进而推演企业真实经营现状、偿债履约水平及潜在经营风险。这类真实业务诉求,对视频尽调AI模型的产业化落地提出了更高标准与全新挑战。
FCMBench-Video所构建的评测方法论,能够助力复杂视频尽调场景筑牢核心技术底座,推动多模态信贷AI评测从“看懂一张图”升级为“理解一座工厂”,逐步完善覆盖信贷全业务流程的评测能力体系,实现评测基准源于业务场景、赋能业务落地。











