ITBear旗下自媒体矩阵:

理想汽车MindVLA-o1发布:五大创新构建物理世界智能驾驶新范式

   时间:2026-03-18 01:46:49 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在NVIDIA GTC 2026大会上,理想汽车基座模型负责人詹锟发表主题演讲,正式推出下一代自动驾驶基础模型MindVLA-o1。这一模型通过五大技术创新,重新定义了自动驾驶系统对物理世界的理解与交互方式,标志着智能驾驶技术向“全能范式”迈出关键一步。

MindVLA-o1的核心突破在于构建了3D空间理解能力。传统自动驾驶系统主要依赖平面图像处理,而新模型通过融合摄像头与激光雷达数据,借助3D编码器技术,使车辆能够精准感知物体的深度、距离及运动轨迹。这种能力让车辆对三维物理空间的认知更接近人类驾驶员,为复杂路况下的决策提供了更可靠的基础。

在决策层面,该模型引入了多模态思考机制。通过隐世界模型技术,MindVLA-o1不仅能实时分析当前环境,还能在虚拟空间中预演未来数秒可能发生的场景。这种“脑补”未来的能力使系统能够提前识别潜在风险,并制定更具预见性的行驶策略,显著提升了决策的主动性与安全性。

行为生成方面,MindVLA-o1采用了VLA-MoE架构,并配备专门的“动作专家”模块。该模块可同步生成所有行驶轨迹点,并通过类似“去噪”的优化算法,确保车辆运动既符合物理规律又保持平稳流畅。这一设计解决了传统系统轨迹生成碎片化的问题,使驾驶行为更加自然连贯。

为加速模型进化,理想汽车开发了闭环强化学习系统。通过构建高保真世界模拟器,模型可在虚拟环境中进行大规模自我训练,无需依赖大量真实道路数据。这种训练方式不仅降低了成本,还使策略优化效率提升数倍,为模型快速迭代提供了技术保障。

在硬件部署上,MindVLA-o1实现了软硬件协同优化。研究团队通过平衡模型精度与硬件延迟,将架构设计周期从数月压缩至数天,使复杂的大模型能够高效运行于车端芯片。这一突破解决了高算力模型与车载硬件兼容性的难题,为量产应用扫清了障碍。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version