在探索智能无人机自主导航的新纪元中,上海交通大学与苏黎世大学的联合研究团队取得了突破性进展。这项研究不仅让无人机在复杂环境中如同飞鸟般自如穿梭成为现实,还颠覆了传统无人机导航对高精度设备、复杂算法及昂贵计算平台的依赖。
该研究的核心成果是一种创新的端到端方法,它巧妙融合了无人机的物理建模与深度学习技术。这一方法首次将可微分物理训练策略成功应用于真实世界的机器人中,使得无人机集群能够在没有地图、通信或昂贵设备支持的情况下实现自主导航,且鲁棒性和机动性远超现有方案。这一成果已在《Nature Machine Intelligence》上发表。
研究团队摒弃了以往无人机自主导航所依赖的高复杂度算法和昂贵传感器,转而采用极简方案。他们使用仅12×16超低分辨率的深度图作为输入,通过仅包含3层卷积神经网络的超小模型,实现了端到端的自主飞行控制。更令人惊叹的是,这一系统能够部署在成本仅150元的廉价嵌入式计算平台上。
在实验中,无人机展现了惊人的表现。在单机测试中,无人机在树林、城市公园及含有静态和动态障碍的室内场景中,导航成功率高达90%,且飞行速度达到20米/秒,是基于模仿学习的现有方案速度的两倍。更令人称奇的是,该系统无需GPS或VIO提供定位信息,就能适应动态障碍物,实现了zero-shot零样本迁移。
多机协同场景中,无人机同样表现出色。研究团队将网络模型部署到6架无人机上,执行同向穿越复杂障碍和互换位置的任务。实验结果显示,无人机在同向穿越门洞、动态障碍物和复杂静态障碍物的场景中展现了极高的鲁棒性,且无需通信或集中规划就能实现自组织行为。
这一突破的关键在于将物理原理嵌入网络训练。研究团队通过可微物理引擎,让无人机“自己学会飞”。端到端的可微仿真训练使得策略网络能够直接控制无人机运动,并通过物理模拟器实现反向传播。整套端到端网络参数仅2MB,却能在RTX 4090显卡上仅用2小时即可收敛。
与强化学习和模仿学习相比,本研究提出的基于可微分物理模型的训练框架展现出了更高的效率和可扩展性。强化学习依赖大量采样数据,数据利用率低,且训练收敛速度慢;模仿学习则需要高质量的专家演示数据,获取成本高且难以覆盖所有场景。而本研究的方法则融合了物理先验与端到端学习的优势,实现了高效、稳定且物理一致的训练过程。
研究团队还通过引入Grad-CAM激活图工具,对策略网络在飞行过程中的感知注意力进行了可视化分析。结果显示,网络的高响应区域高度集中在飞行路径中最可能发生碰撞的障碍物附近,这表明网络已自发学会将注意力集中在潜在风险最大的区域上,从而验证了网络的决策过程具有一定的结构合理性与物理解释性。