在水下作业场景中,浑浊的海水始终是困扰机器人高效工作的难题。当水下机器人执行海底挖掘、抓取等任务时,螺旋桨和机械臂搅起的泥沙会在短时间内让周围环境变得一片混沌,摄像头瞬间失去作用,机器人往往只能原地等待泥沙沉降,这一过程不仅浪费时间,更在排爆、打捞、设施巡检等关键任务中增加了成本与风险。
近日,美国麻省理工学院与伍兹霍尔海洋研究所的科研团队取得重要突破,开发出一套名为Sonar-MASt3R的水下测绘系统。该系统创新性地将声呐传感器的声学数据与光学摄像头的视觉图像相融合,使水下机器人在低能见度的浑浊水域中也能实时生成精细的三维地图,为解决水下作业难题提供了新方案。
这一研究的灵感部分源于水下未爆弹药清除的实际需求。许多历史遗留的爆炸物埋藏在近岸海域的沉积物中,不仅威胁航运安全,也给海洋工程带来潜在风险。长期以来,水下感知技术主要依赖光学摄像头和声呐两种方案。光学摄像头能提供丰富的纹理、颜色和细节信息,但对环境要求苛刻,在深海、夜间或被泥沙遮蔽的区域,其获取信息的能力会大幅下降。而声呐则几乎不受水体浑浊程度影响,通过发射声波并分析回波来测量目标的距离、轮廓和深度,即便在完全黑暗的环境中也能正常工作。不过,声呐也有局限性,它只能勾勒出目标的大致轮廓,难以准确识别目标的具体信息。
过去十多年,研究人员一直致力于将视觉与声学两种感知方式结合,即“光学-声学融合”,理论上这种结合能兼顾分辨率与鲁棒性,但实现起来困难重重。此前的大多数研究主要针对目标识别或局部场景重建,且需要离线处理数据,难以满足实时作业需求,能够同时实现实时运行、三维建图并适用于高浑浊水下环境的系统十分罕见。
Sonar-MASt3R系统脱胎于名为MASt3R的图像匹配算法,该算法由法国Naver Labs Europe团队开发。相比前代,MASt3R最大的改进是在网络中增加了专门输出稠密局部特征图的模块,并配合快速互惠匹配算法,能从多张二维图像中快速估算场景内每个像素的相对深度,在不依赖相机位姿信息的情况下实时生成三维点云。然而,MASt3R输出的是相对深度,无法提供精确的实际距离信息,这对于需要精确判断距离以避免碰撞的水下机器人来说远远不够。
为了弥补这一不足,研究团队提出了新的思路:利用声呐提供真实距离信息。由于声波传播速度已知,声呐可通过回波返回时间直接计算目标的实际距离和深度,为场景提供可靠的绝对尺度信息。Sonar-MASt3R系统的工作过程分为两个阶段。首先是“声呐扫描”阶段,实验中,搭载声呐传感器的机械臂在水箱中缓慢横向扫描,系统根据收集的声学数据快速生成环境的粗略三维轮廓图,这张地图虽缺乏视觉细节,但能准确标注空间尺度信息,如巨石、箱体的位置以及它们与机器人的距离。随后进入“光学抵近”阶段,机器人根据声呐地图判断目标位置,安全靠近目标。当距离足够近时,水下摄像头开始采集高分辨率图像,并将其送入改进后的MASt3R管线进行处理。
为保证实时性,系统采用“关键帧”策略,每帧新图像与上一关键帧比较,若包含新环境信息则纳入地图,内容变化不大则直接丢弃,既减少了冗余计算,又确保建图过程持续实时运行。研究团队在伍兹霍尔海洋研究所的水箱设施中搭建可控实验环境,放置小型岩石、咖啡杯和包装箱等目标物体,并通过搅动沉积物制造8种不同程度的浑浊环境。实验结果显示,在所有浊度条件下,Sonar-MASt3R的三维建图精度和分辨率均优于此前的方法,能识别厘米级别的细节。即便在最极端的浑浊条件下,光学摄像头几乎失效,声呐仍能勾勒出隐藏物体的大致轮廓,引导机械臂安全接近目标并获取清晰视觉信息。
有趣的是,研究团队认为,他们验证算法的水箱环境比真实海洋更加苛刻。在封闭水箱中,声波会在四壁间不断反射,产生大量混响、畸变和“鬼影”,使声呐数据变得复杂。而在开放海域中,声波能向更远处扩散,多径反射较少。这意味着,如果Sonar-MASt3R能在这种“困难模式”下稳定运行,进入真实海洋后,其表现理论上会更好。不过,该系统距离大规模应用还有很长的路要走,研究团队计划将其带出实验室,在真实水域开展进一步测试,以应对复杂海况、洋流干扰以及长时间连续运行的考验。











