ITBear旗下自媒体矩阵:

蚂蚁灵波科技开源LingBot-Depth模型,为智能终端三维视觉突破难题添新翼

   时间:2026-01-27 18:10:28 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁集团旗下具身智能公司灵波科技近日宣布开源高精度空间感知模型LingBot-Depth,为机器人与自动驾驶领域带来三维视觉技术突破。该模型基于奥比中光Gemini 330系列双目3D相机的原始数据构建,通过融合光学传感与深度学习技术,显著提升了智能终端在复杂环境中的空间理解能力,尤其在透明物体、反光表面等传统感知难题场景中展现出显著优势。

在权威基准测试中,LingBot-Depth刷新多项行业纪录。NYUv2室内场景测试显示,其相对误差(REL)较主流模型降低超70%;ETH3D稀疏SfM任务中,均方根误差(RMSE)下降约47%。这种代际级性能跃升源于模型对RGB-D数据的深度整合能力——当深度传感器因透明材质或强反光失效时,系统可自动调用彩色图像的纹理特征与环境上下文信息,通过掩码深度建模(MDM)技术完成缺失区域的高精度补全。

实验数据证实技术突破的实用性。搭载LingBot-Depth的Gemini 330相机在玻璃器皿、镜面反射等极端场景下,输出的深度图边缘锐度提升40%,数据完整度达98.7%,显著优于Stereolabs ZED系列等国际领先产品。奥比中光深度视觉实验室认证表明,该方案在保持消费级硬件成本的同时,将复杂场景适应能力提升至工业级标准。

支撑技术突破的是灵波科技构建的千万级场景数据库。研发团队采集近千万原始样本,筛选出200万组高价值深度配对数据用于模型训练,其中包含200万真实世界数据与100万仿真数据。这套核心数据资产将随模型代码同步开源,为行业提供攻克复杂场景感知难题的基础设施。

产业合作同步推进。奥比中光已宣布将基于LingBot-Depth技术路线开发新一代深度相机,重点优化家庭服务机器人与自动驾驶汽车的近场感知能力。据悉,灵波科技本周还将陆续开源多款具身智能核心模型,构建从环境感知到决策控制的完整技术生态。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version