ITBear旗下自媒体矩阵:

从模仿到判断:World Engine以Post-Training范式引领自动驾驶迈向物理AGI新时代

   时间:2026-04-19 21:31:59 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

自动驾驶技术发展至今,预训练模型虽已具备基础驾驶能力,却始终难以突破“知其然不知其所以然”的瓶颈——系统能按规则行驶,却无法理解“为何这样决策更安全”。这一困境在雨夜逆行电动车、施工路段突发障碍等长尾场景中尤为突出。香港大学与华为联合研发的World Engine系统,通过后训练范式与闭环仿真技术,为自动驾驶进化开辟了新路径。

传统自动驾驶系统依赖海量数据预训练,但真实路测中危险场景占比不足0.1%。研究团队发现,单纯扩大数据规模对安全关键场景的优化效果有限:当预训练数据从1.3万个场景增至10.3万个时,常规驾驶表现持续提升,长尾场景能力却迅速触及天花板。这一现象揭示了物理世界AI的特殊挑战——错误决策的不可逆性要求系统必须在部署前“预见”所有极端情况。

World Engine的核心突破在于构建“生成-训练-反馈”闭环体系。系统首先通过行为世界模型从真实数据中挖掘碰撞、停滞等高危场景,再利用解耦扩散技术生成变体场景。例如,在保持道路拓扑不变的前提下,模拟行人突然冲出、前方车辆急刹等对抗性行为,使训练数据中的长尾场景密度提升14倍。这些场景通过3D高斯泼溅技术重建为高保真三维环境,为后训练提供物理真实的交互基础。

强化学习驱动的后训练模块将安全价值编码为奖励信号。与常规训练不同,系统在仿真环境中与动态生成的难例反复博弈:当自车正确避让突然变道的车辆时获得正向奖励,违规压线则受到惩罚。这种训练方式使模型不仅学会“模仿人类驾驶”,更掌握“在复杂交互中做出最优决策”的能力。实验数据显示,经过后训练的模型在切入碰撞指标上降低45.5%,无保护左转等高风险场景通过率提升23%。

该技术的工业验证在华为ADS 4.0架构中完成。研究团队利用工业级闭环仿真平台,对系统进行超1万次、覆盖3000公里的极端场景测试。在上海真实路测中,搭载World Engine的车辆成功应对夜间施工区临时改道、行人盲区横穿等挑战,全程无需人工接管。这些场景即使对人类驾驶员也构成考验,系统却能通过预判风险、调整车速等细微操作实现安全通行。

World Engine的技术范式具有跨领域应用潜力。在机器人手术、工业自动化等物理世界AI场景中,关键操作的成功率同样受限于训练数据的极端稀缺性。研究团队正探索将3D场景重建技术迁移至医疗仿真领域,通过生成罕见病例的手术场景提升模型应对能力。这种“主动创造经验”的思路,为解决物理世界AI的数据困境提供了通用解决方案。

该项目的学术贡献在于重新定义了自动驾驶训练范式。传统端到端系统将感知、预测、规划模块分开优化,World Engine则通过后训练打通全链路能力进化。其创新点体现在三个方面:一是将安全价值显式编码为训练目标,二是构建动态生成的闭环仿真环境,三是实现从数据驱动到经验驱动的范式转变。这种设计使系统在保持基础驾驶能力的同时,获得应对未知场景的泛化能力。

目前,World Engine的相关代码与数据集已开源,包含场景生成工具链、强化学习框架及基准测试集。研究团队表示,后续工作将聚焦于提升世界模型的生成效率,以及探索多智能体交互场景的仿真技术。随着物理世界AI向更复杂的任务拓展,这种“在仿真中预演失败”的训练方式,或将成为通用智能体落地前的关键步骤。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version