ITBear旗下自媒体矩阵:

无需专家示范!特伦托大学与中山大学新研究解锁自动驾驶安全学习新路径

   时间:2026-02-28 02:57:57 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

自动驾驶技术正迎来一场革命性突破。意大利特伦托大学与中山大学联合研发的RaWMPC系统,通过完全摒弃专家示范的学习模式,开创了自动驾驶安全决策的新范式。这项发表于arXiv平台的研究成果,在权威测试平台Bench2Drive和NAVSIM上创造了多项性能纪录,标志着自动驾驶技术从"模仿学习"向"理解学习"的关键跨越。

传统自动驾驶系统高度依赖专家驾驶数据,如同学生机械背诵标准答案。当遇到训练数据中未涵盖的突发状况时,系统往往陷入决策困境。研究团队创新性地提出"风险感知世界模型",通过构建虚拟驾驶模拟器,使系统能够自主推演不同驾驶行为的潜在后果。这种机制类似于围棋高手的"脑内推演",系统在决策前会快速模拟直行、转弯、停车等多种选择,并评估每种方案的风险等级。

该系统的核心技术突破体现在风险感知交互学习策略上。研究团队设计了三阶段学习模式:随机探索阶段让系统自由尝试各种驾驶行为;安全行为模式引导系统优先选择低风险操作;最关键的危险体验模式则允许系统在虚拟环境中故意实施危险驾驶,通过亲身体验碰撞、违规等严重后果,建立风险认知能力。这种"接触式学习"机制显著提升了系统对极端场景的应对能力。

为解决实时决策的计算效率问题,研究团队开发了自我评估蒸馏技术。该技术通过构建"教师-学生"网络架构,使经过充分训练的世界模型能够指导轻量化行为生成网络。在保持预测精度的同时,将决策速度提升至毫秒级,满足实时驾驶的严苛要求。对比实验显示,该技术使系统在保持88.31分综合得分的同时,决策效率提升3倍以上。

在Bench2Drive平台的测试中,RaWMPC系统在220条测试路线、23种天气条件下展现出卓越性能。即便完全不使用专家数据,系统仍取得87.34分的成绩,超越多数依赖海量示范数据的传统系统。特别在雨天等极端天气测试中,系统性能衰减幅度较传统方法降低42%,证明其具有更强的环境适应能力。NAVSIM平台的实景测试进一步验证了系统的实用性,在PDMS指标上达到91.3分的新高。

该系统的决策透明性引发行业关注。不同于传统深度学习模型的"黑箱"特性,RaWMPC能够清晰展示决策依据:系统会同步输出每种候选行为的碰撞概率、违规风险、效率损失等量化指标。这种可解释性设计不仅有助于建立用户信任,更为安全监管提供了可视化工具。在典型测试场景中,系统面对突然出现的行人时,能够准确评估急刹、绕行等方案的连锁反应,最终选择最优避险路径。

技术实现层面,研究团队采用多项创新设计。视觉编码器运用预训练变换器架构,有效处理多摄像头输入数据;世界模型采用自回归预测机制,可生成长达5秒的未来场景序列;风险评估模块引入时间衰减权重,使近期预测获得更高关注度。这些技术组合使系统在保持91.3分高得分的同时,计算资源消耗较传统方法降低35%。

尽管取得突破性进展,研究团队坦言系统仍存在改进空间。当前模型在预测长时间场景时存在误差累积现象,特别是在处理复杂交通参与者行为时准确性有待提升。仿真环境与真实道路的差异仍是部署挑战。针对这些问题,团队正探索更高效的神经网络架构和领域自适应技术,计划将激光雷达等多模态传感器融入系统,进一步提升环境感知能力。

这项研究对自动驾驶行业产生深远影响。其自主学习模式大幅降低数据采集成本,使中小研发机构有机会参与核心技术竞争。更重要的在于技术范式的转变——从被动模仿转向主动理解,这种转变可能重塑整个行业的技术发展路线。目前,多家车企已与研究团队展开合作,探索该技术在量产车型中的应用可能性。

对于希望深入了解技术细节的读者,可通过论文编号arXiv:2602.23259v1获取完整研究报告。该成果不仅为自动驾驶领域提供新思路,其核心的世界模型和预测控制机制,也为机器人导航、工业自动化等领域的技术发展带来启示。这场由风险感知驱动的技术变革,正在重新定义机器智能的边界。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version