ITBear旗下自媒体矩阵:

辅助驾驶新纪元:千万Clips数据,谁将领跑第一梯队?

   时间:2025-06-09 11:10:07 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在智能驾驶领域,数据、算法与算力被视为推动技术进化的三大支柱,其中数据被形象地比喻为驱动大模型跃进的“燃料”。然而,在这条由数据主导的发展道路上,车企与供应商的命运却似乎出现了分歧。

凭借与用户之间的直接联系,车企在数据积累上构建了坚实的壁垒。理想、奇瑞、吉利等车企纷纷宣布,其数据量已达到千万级别Clips(数据片段),而小鹏更是将数据规模翻倍,达到了2000万Clips。马斯克曾指出,对于端到端辅助驾驶系统而言,经过千万级别的Clips训练,系统将展现出惊人的表现。这似乎预示着,车企在数据积累上的优势将助力其更快触及大模型的升级临界点。

然而,供应商在数据积累上则面临更多挑战。除非能够获得车企的信任,否则在千万级别Clips的数据积累上,供应商需要付出更多努力。但值得注意的是,数据驱动的竞争并非单纯依赖数量取胜。

地平线创始人兼CEO余凯提出了一个反共识观点:“在AI时代,99%的用户数据其实不值得学习。”这一观点背后,是对数据价值的深度重构。在端到端架构与生成式AI的冲击下,数据战争的胜负关键不再是谁拥有更多的“燃料”,而是谁能高效利用有限的数据实现效能的飞跃。

那么,千万级别的Clips究竟意味着什么?首先,我们需要明确“Clip”的含义。Clip通常指的是由激光雷达、摄像头、毫米波雷达等多种传感器同时捕获的、在特定时间段内的多模态数据片段。这些数据片段通常与4D标注技术密切相关,即在传统三维空间坐标之外,还加入了时间维度,从而能够更全面、准确地描述物体在空间中的运动情况。

业内专家指出,一个Clip通常代表一段约30秒左右的视频切片。毫末智行认为,相比以往的2D、3D数据标记方式,4D Clips的数据规模实现了百倍级的增长,是当前最具价值的感知数据形态。因此,千万级别的Clips意味着系统拥有了千万个信息密集的视频切片,这些切片在极端场景覆盖率和数据场景分布上都具有显著优势。

理想汽车将道路行驶中的场景分为静态场景和动态场景,通过筛选不同复杂程度的场景进行训练,使得辅助驾驶系统的处理能力更加拟人化和高效。理想认为,千万级别的Clips模型相当于系统具备了一名职业老司机的能力,能够安全、舒适、高效地应对各种驾驶情况。

小米、吉利、奇瑞等车企在展示数据储备时,也将千万级别的Clips作为重要论据。这一论据不仅传递了系统可靠性和未来潜力的信息,还通过大模型的体验提升印证了数据驱动方式的高效与先进性。例如,理想AD Max V13系统在经过千万级别Clips的训练后,已经能够展现出更加灵活和智能的驾驶决策。

然而,数据的质量同样至关重要。轻舟智航CEO于骞强调,数据训练的关键在于覆盖维度和数据质量。在数据清洗过程中,需要剔除重复场景和不合理驾驶行为的数据。余凯的反共识观点也指出,大部分人类司机的驾驶技术和习惯并不合理,因此大部分人类司机数据并不值得学习。建立严格的数据筛选和评估标准成为必要举措。

理想汽车从百万用户的真实驾驶数据中,仅筛选出5%的高质量数据纳入训练集。这一“极致提纯”的过程折射出辅助驾驶领域的核心矛盾:数据价值不在于量的堆砌,而在于质的穿透。车企和供应商在获取高质量数据上采取了多种方式,包括众包模式、自建路测团队和数据仿真等。

众包模式允许车企在用户授权后匿名采集真实驾驶数据,而自建路测团队则能够精准控制采集场景并提升训练效率。数据仿真技术则通过生成式AI技术批量生成虚拟场景,以覆盖真实路测中难以遇到的极端情况。然而,目前数据仿真技术仍主要扮演辅助角色,随着辅助驾驶技术的持续进阶,三种数据采集方式的权重也将发生动态变化。

在后端到端时代,行业正呈现出全新生态。技术焦点已经从“是否端到端”转变为“端到端之后的研究方向”。在算法、算力、数据的共同推动下,技术的演进对数据产生了新的需求。强化学习和视觉-语言-动作(VLA)模型等新技术趋势逐渐成为共识,它们对高质量数据的渴求不变。

强化学习通过虚拟环境的“奖惩反馈”主动试错探索,使系统能够自主探索复杂场景。VLA模型则使系统能够听懂并执行指令,同时在陌生环境中表现出色。然而,在数据应用过程中,如何规避幻觉数据干扰、构建科学的评价体系仍是一个持续探索的过程。

随着辅助驾驶赛道向深水区延伸,玩家之间的分化不断加速。由技术投入强度、数据积累速度、场景覆盖广度构成的核心筛网,让头部玩家与追赶者的差距不断扩大。在当前这个关键赛点上,谁先迈过千万级别Clips的数据门槛,谁就将获得辅助驾驶第一梯队的入场券。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version