蚂蚁集团旗下灵波科技近日宣布,正式开源其自主研发的空间感知模型LingBot-Depth,为具身智能领域带来突破性解决方案。该模型聚焦传统深度相机在复杂场景中的技术局限,通过软件算法弥补硬件性能短板,为机器人感知能力升级开辟新路径。
在透明物体、玻璃表面及高反光材质等特殊场景中,现有深度相机常因光线干扰无法获取有效数据,导致机器人抓取失败或碰撞事故频发。LingBot-Depth创新采用"掩码深度建模"技术,通过在训练阶段随机遮挡部分深度数据,迫使模型学习从RGB图像中推断缺失信息。这种训练方式使模型具备强大的数据补全能力,能够结合物体纹理、轮廓等视觉特征,对存在噪声或缺失的深度数据进行智能修复。
实测数据显示,搭载该模型的机器人在处理透明储物盒时,抓握成功率提升至50%,较传统传感器实现质的飞跃。在NYUv2、ETH3D等国际权威基准测试中,LingBot-Depth在深度补全、单目深度估计及双目匹配三项核心指标上均达到行业领先水平。特别在视频流处理方面,模型无需额外时序建模即可生成稳定连贯的深度序列,有效解决了传统方法易出现的画面闪烁和结构畸变问题。
硬件适配性方面,该模型与奥比中光Gemini 330系列双目3D相机完成深度优化,实测表现优于国际知名品牌ZED深度相机。这意味着消费级设备无需更换高价传感器,即可显著提升对复杂场景的感知能力。灵波科技透露,模型已实现全维度开源,除核心代码外,后续还将公开300万组标注数据集,包含200万组实拍RGB-D样本及100万组渲染数据。
此次技术突破源于灵波科技与奥比中光的战略协同,双方计划联合推出新一代智能深度相机。据研发团队介绍,LingBot-Depth仅是空间智能技术布局的起点,本周内还将陆续发布多项具身智能领域的创新成果,持续推动机器人感知技术的边界拓展。











