随着人工智能技术发展进入新阶段,自动驾驶领域正经历一场深刻的范式变革。在刚刚落幕的全球计算机视觉顶级会议ICCV 2025上,理想汽车自动驾驶团队展示的系列创新成果,为行业描绘出技术演进的新路径。
自动驾驶高级算法专家詹锟在具身智能研讨会上提出的"训练闭环"理念,标志着行业从数据驱动向智能驱动的关键转折。理想汽车构建的全球首个量产级世界模型与强化学习融合架构,通过环境生成、智能体交互和反馈优化形成完整训练体系,有效解决了传统端到端方案在极端场景下的数据稀缺难题。
技术演进呈现清晰的迭代轨迹。从规则算法到端到端方案,再到当前VLA(视觉语言行动)架构的成熟应用,理想汽车在辅助驾驶领域实现了三次重大跨越。其双系统架构将E2E实时决策与VLM认知推理相结合,使MPI(人类接管里程)指标在12个月内显著提升。当训练数据量突破千万级后,团队通过引入合成数据与真实数据融合训练,成功突破边际效应瓶颈。
在环境建模领域,理想提出的Hierarchy UGP技术引发学界关注。该技术采用根层-子场景层-图元层的三维分层结构,配合四维空间统一高斯图元表示,实现了对动态场景的高精度重建。研究显示,这种建模方式在处理复杂交通场景时,模型容量提升3倍以上,能够准确还原任意动态元素。
数据合成能力的突破为技术发展注入新动能。理想团队开发的提示词生成系统,可实时创建包含视频和点云的虚拟场景,特别适用于新法规环境、特殊地理区域等罕见场景的模拟训练。这种技术使模型在极端天气、复杂路况等场景下的决策稳定性提升40%,同时降低25%的实车测试成本。
在技术落地层面,理想构建的完整技术栈涵盖场景重建、多模态生成、智能体交互等12个关键模块。其中3D资产库包含超过20万种交通元素模型,评价反馈系统支持毫秒级决策评估。算力基础设施的升级使模型训练效率提升5倍,为实时强化学习提供了硬件支撑。
学术成果方面,理想团队在ICCV 2025上展示了五项突破性研究。除Hierarchy UGP外,3DRealCar数据集通过2500辆汽车的360度扫描,创建了业界首个高保真汽车模型库;World4Drive框架利用潜在世界模型实现无需标注的端到端规划;HiNeuS神经表面重建技术解决了低纹理场景下的建模难题;RoboPearls视频模拟框架则开创了机器人操作的可编辑仿真新范式。
面向未来技术挑战,理想明确了两个重点突破方向。强化学习引擎需要同时满足泛化性、实时性和大规模并发需求,团队正着力优化世界模型精度、3D资产丰富度和奖励模型效率。交互式智能体研究则通过调整强化学习奖励机制,实现多智能体协同决策,相关成果MAD系统即将发布。
作为首家将VLA架构应用于量产车型的企业,理想汽车的技术布局已产生显著行业影响。其开源的辅助驾驶代码库被全球3200余名开发者使用,提出的VLA技术范式正成为行业新标准。在研发投入方面,公司近半研发预算投向人工智能领域,组建的四支专业团队分别深耕辅助驾驶、智能交互、工业智能化和商业智能化方向。
 










 
  









