ITBear旗下自媒体矩阵:

李想详解智驾未来:VLA架构能否引领行业破晓?

   时间:2025-05-07 23:25:33 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在智能驾驶技术的浪潮中,理想汽车再次站上了风口浪尖。CEO李想近期在理想AI Talk系列活动中,对智能驾驶技术的未来蓝图进行了深入剖析,特别是关于VLA(视觉语言行动模型)的探讨,引起了业界的广泛关注。

早在2024年末,李想在第一季AI Talk上就预言,智能驾驶的基座模型终将进化为VLA。这一观点,在理想汽车于同年10月推出端到端+VLM(视觉语言模型)智驾方案后不久,便显得尤为前瞻。然而,年底时李想又明确表示,理想汽车将全力押注VLA,这一转变或许让部分用户感到困惑,毕竟端到端+VLM方案尚处推广初期。

进入2025年,理想AI Talk第二季上,李想进一步阐述了为何选择VLA作为现阶段的最强架构。他指出,VLM在处理复杂场景时,如京承高速等拥有众多ETC出入口的路段,其位置判断能力显得力不从心。VLM的架构缺陷,使得单纯增加语料数据无法从根本上解决问题。相比之下,VLA通过结合视觉、语言及行动数据,展现出更接近甚至超越人类驾驶能力的潜力。

为了构建VLA,理想汽车采取了三步走的策略:首先是VL(视觉语言)基座预训练,这一步相当于人类通过学习视觉、语言及二者联合数据来认知世界;其次是辅助驾驶后训练,类似于人类在驾校学习驾驶,通过实际操作数据训练出VLA司机大模型;最后是强化学习,通过日常驾驶中的反馈,进一步优化VLA对交通规则的理解及符合用户驾驶习惯的能力。

理想汽车的VLA方案,最终以司机Agent的形式呈现,能够理解人类自然语言指令,实现用户意图与车辆动作的精准匹配。在测试中,司机Agent能够根据语音指令在不退出NOA(导航辅助驾驶)的情况下切换路线,或在高速出入口选择人工通道,展现了极高的灵活性和智能性。

面对VLA方案仍存在的黑盒问题,理想汽车采取了积极措施。他们组建了超过1000人的超级对齐团队,并构建了仿真世界模型,以在虚拟环境中验证司机Agent的专业性、职业性和信任构建能力。这一举措不仅大大降低了验证成本,还提高了测试效率。

针对英伟达Orin-X芯片无法直接运行语言模型的挑战,理想汽车凭借自研的底层推理引擎和INT4量化技术,成功实现了VLM在芯片上的运行。这一技术创新,彰显了理想汽车在智能驾驶技术领域的深厚底蕴和原创能力。

对于近期辅助驾驶车型事故频发、消费者信任度下降的现象,理想汽车持乐观态度。他们认为,这只是技术发展过程中的暂时挫折,不会阻碍技术的进步。理想汽车将继续秉持谨慎态度,加强验证频次,确保技术的安全性和可靠性。

作为国内辅助驾驶技术的领军者,理想汽车正通过VLA方案,为整个行业带来新的启示和思考。未来,随着技术的不断演进和完善,智能驾驶技术将更加成熟、可靠,为人们的出行带来更多便利和安全。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version