近期,智能驾驶领域迎来了一波技术更新的高潮,多家头部企业相继宣布在智能驾驶技术上取得重大突破,并计划将这些新技术应用到实际产品中。这一系列动作,让人不禁联想到上一次由“端到端”模型引领的行业变革,但此次变革的深度与广度似乎更为显著。
这股智能驾驶竞赛的浪潮,背后有多重因素的推动。首先,年初官方对智能驾驶宣传的调控,虽然暂时减缓了部分公司的宣传节奏,但同时也促使这些公司更加专注于技术研发和产品落地。其次,各家公司在智能驾驶技术和产品上的创新,大多基于AI领域的底层技术突破,这些突破在时间节点上相对集中,为技术的快速迭代提供了可能。再者,将AI底层技术应用于智能驾驶,需要大量的训练和调整,这一过程的时间周期相对固定,也导致了新技术发布的集中性。最后,各家公司都看到了智能驾驶能力提升的巨大潜力,担心被竞争对手抢先发布,因此大多选择了先发布“基础版”再进行优化的策略。
在这波竞赛中,一个显著的技术趋势是VLA大模型的广泛应用。与之前的端到端模型相比,VLA大模型去掉了规控时代留下的多个环节,从传感器到控制端只有一个完整的模型,大大提高了系统的整体性和效率。同时,VLA大模型以Transformer为核心,相比CNN为核心的早期AI技术,大幅提升了模型对人类大脑的模仿学习能力。
VLA大模型的出现,让智能驾驶系统具备了思维链(CoT)能力,这意味着模型不再是一个从感知输入到控制输出的“黑箱”,而是能够通过引入语言作为媒介,模仿人类驾驶员的思考模式,将复杂的驾驶决策分解为一系列连贯、有逻辑的中间推理步骤。这种能力不仅增强了决策的逻辑性和可靠性,还提升了系统的可解释性和透明度,使得研发人员能够更容易地进行模型调试和优化,同时也为事故追溯、责任界定提供了清晰的依据。
在实际测试中,VLA大模型的表现令人印象深刻。特别是在防御性驾驶方面,VLA模型能够像人类驾驶员一样,对潜在风险保持先验性的警觉。例如,在深圳常见的立交桥下辅道,人车混行、视野狭窄的情况下,VLA模型能够持续进行自我推理,主动将车速降至绝对安全的范围。在被花坛遮挡视线的路口,当感知到对向车道有电瓶车高速驶来时,它的驾驶决策会立刻从“控速”升级为“主动降速”,预留出足够的反应空间。这种“让AI学会害怕”的能力,让智能驾驶系统在面对复杂或罕见路况时,能够做出更为可靠和安全的决策。
VLA大模型的应用还带来了智能驾驶系统体验上的综合性飞跃。更顺滑的控车、更果断的反应以及贯穿全程的“安全感”,让驾驶者在使用智能驾驶系统时更加放心。尽管在极端场景下仍需人类接管,但那种驾驶时“心里有底”的信任感,是此前任何系统都难以给予的。同时,由于VLA大模型能够读取交通标识上的文字说明并按照指示优化驾驶,这使得智能驾驶系统更加智能和灵活。
对于智能驾驶技术的未来发展,业内人士认为,VLA大模型的成本差异主要在芯片上,但目前来看,15万元以上的车型都可以适配,10万元级别的车型通过优化也有机会搭载。同时,随着智能驾驶技术的不断发展,芯片厂商也一定会加强对Transformer的支持,尤其是在高精度算力优化上。对于想要自研辅助驾驶系统的车企或供应商来说,也很难跳过从规则算法、端到端1.0到VLA模型的发展过程,每个阶段都有自己的技术积累和Know-How。