在自动驾驶领域,元戎启行最新推出的VLA模型正引发广泛关注。该模型不仅融合了先进的语言处理能力,还具备强大的思维链功能,能够解析复杂环境,有效摆脱传统自动驾驶模型的黑盒困扰。通过串联并分析信息,VLA模型能够推理出因果关系,展现出卓越的驾驶决策能力。
据元戎启行介绍,VLA模型内置海量知识库,泛化性能出众,能够更好地适应多变的真实道路环境。长远来看,其强大的语言和推理能力被视为实现完全无人化自动驾驶的关键。VLA模型具备四大核心功能:空间语义理解,能精准还原复杂场景,尤其是盲区;异形障碍物识别,能够辨识各类车辆和物体;文字类引导牌识别,有效解读临时标志和道路信息,减少误判;以及记忆语音控车,支持基础指令,并能记忆用户偏好。
在搜狐汽车的体验中,VLA模型在应对桥洞、丁字路口等盲区场景时,能够提前减速或停车观察,行驶决策既谨慎又流畅。同时,该系统还能将识别到的道路文字和思维链过程以文字形式呈现在车机屏幕上,提升了驾驶的透明度和安全性。
元戎启行CEO周光表示,VLA模型的表现已经超越了第一代端到端方案的上限。当前以CNN为基础的模型正面临性能瓶颈,无论增加多少数据或采用何种额外训练手段,提升空间都十分有限。相比之下,VLA模型在推理和预判能力上展现出显著优势,特别是在“防御性驾驶”方面表现突出。对元戎启行而言,这种“防御性”驾驶不仅提升了安全性,更是技术上的一次重要突破。
除了技术上的先进性,元戎启行在发布会上还展示了其在商业应用上的务实态度。VLA模型在兼容性方面表现出色,能够适配不同的感知硬件方案和车端多芯片平台。这意味着VLA模型不仅能够支持激光雷达融合感知方案,还能兼容纯视觉方案,为车企提供了更多选择。同时,VLA模型还能适配包括英伟达、高通、地平线、黑芝麻在内的多家芯片公司的芯片,大大拓宽了潜在用户范围。
在价格方面,VLA模型也展现出了强大的竞争力。目前,15万元以上的车型均可适配该模型,而10万元级别的车型通过优化也有机会搭载。这意味着VLA模型将有机会进入中国汽车市场的主流价格区间,为更多消费者提供智能驾驶体验。此前,元戎启行的量产车型多定位在30万元以上,而此次拓展至更低价格区间,无疑将加速智能驾驶技术的普及。
然而,挑战依然存在。尽管元戎启行在技术上取得了显著进展,但要在更低价格区间内提供高质量的智能驾驶体验,仍需要面对成本控制和市场竞争的双重考验。在汽车行业高度竞争的环境下,VLA模型需要不断优化性能,降低成本,以赢得更多市场份额。
面对这些挑战,元戎启行和周光表现出了长期主义的态度。他们认为,行业竞争有利于行业发展,但需要保持敬畏之心,理性宣传,避免过度承诺。同时,技术发展需要时间,需要正确引导用户预期,加强监管和行业自律。在技术与市场的双重考验下,元戎启行正迈入新阶段,迎接市场的检验和友商的挑战。