ITBear旗下自媒体矩阵:

商汤科技发布SenseNova-SI系列模型,空间智能领域表现超GPT-5等顶尖模型

   时间:2025-11-11 08:42:27 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

商汤科技近日宣布,正式推出并开源其最新研发的SenseNova-SI系列空间智能大模型。这一系列模型在空间理解与推理任务中表现卓越,不仅显著超越同量级开源多模态大模型,更在多项国际权威评测中领先于GPT-5和Gemini 2.5 Pro等顶尖闭源模型,标志着我国在空间智能领域取得重要突破。

当前,主流大模型在知识储备、文本生成、逻辑推理和编程能力等方面已展现出强大实力,但在空间结构理解与推理方面仍存在明显短板。这种能力恰恰是具身智能体与物理世界交互所需的核心基础。商汤科技此次发布的SenseNova-SI系列,正是针对这一痛点进行专项突破的创新成果。

该系列包含2B和8B两种参数规模的模型版本。根据官方公布的评测数据,SenseNova-SI系列在VSI、MMSI、MindCube、ViewSpatial等空间智能基准测试中均取得优异成绩。其中,8B版本模型在四个核心评测中平均得分达60.99,较Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源通用多模态模型,以及SpatialMLLM(35.05)、ViLaSR-7B(36.41)等专用空间智能模型均有显著优势。更引人注目的是,这一轻量化模型在性能上超越了GPT-5(49.68)和Gemini-2.5-Pro(48.81)等国际顶级闭源模型。

实际测试案例进一步验证了该模型的空间智能优势。在立方体组合图形的俯视图识别任务中,面对复杂三维结构,SenseNova-SI-8B准确选择正确答案,而GPT-5出现判断错误。在空间方位判断场景中,当测试者模拟手持相机者的视角时,该模型能正确识别摩托车位于右侧,而GPT-5误判为左侧。在动态场景理解方面,模型准确预测黄色汽车将进行右转动作,而GPT-5判断为静止状态。

在视角变化分析任务中,SenseNova-SI-8B展现出更强的空间推理能力。面对户外场景的视角转换,模型能精准判断物体向左前方移动;在室内空间分析中,通过白板、沙发等家具的位置变化,同样得出正确的移动方向判断。另一项测试中,模型从正面视角准确识别桌子右侧物体为门,而GPT-5的判断出现偏差。这些案例充分证明,该模型在空间智能领域已实现质的飞跃。

目前,SenseNova-SI系列模型已通过开源方式向全球开发者开放。相关代码和文档可通过指定代码仓库获取,这一举措将为空间智能技术的研究与应用提供重要基础设施,推动整个领域向更高水平发展。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version