在人工智能的发展历程中,数据始终是推动技术进步的关键因素。十多年前,李飞飞在普林斯顿大学期间,敏锐地察觉到了数据稀缺对人工智能发展的制约。自2009年起,她和团队开始从互联网上搜集数十亿张图片,创建了覆盖全球的视觉分类数据库ImageNet,并启动了ImageNet挑战赛。这一举措极大地促进了深度学习在图像识别领域的应用,为人工智能的爆发奠定了基础。
如今,人工智能正逐步从图像、语音处理领域拓展至自动驾驶、机器人等物理世界密切相关的领域。然而,与当年2D图像数据稀缺相似,3D空间数据也成为了制约算法发展的瓶颈。自动驾驶和机器人领域的领先企业都在积极寻找用于模型训练的数据资源。
近日,在北美ADAS与AV技术峰会上,一家名为ROVR的3D数据公司与UC Berkeley、清华大学共同宣布开源一批3D数据。这批数据包含1400个视频片段,共20万帧,涵盖了点云、GPS、RTK、IMU等多种信息,地域覆盖欧洲、北美、东南亚等地,场景包括动态与静态目标,以及不同道路类型和天气条件。ROVR团队表示,这只是他们打造全球最大开源3D数据集的开端。
3D数据的稀缺性源于多个方面。首先,高质量的3D空间数据在过去要么不存在,要么成本高昂。地图厂商虽然提供此类数据,但价格较高且地域化特征明显。其次,现有的3D数据集如nuScenes、KITTI、Waymo Open Dataset等已显滞后,部分数据集因大公司公关需求而发起,已多年未更新;且激光雷达点云数据多采用早期的机械式激光雷达,与当前量产的车规级激光雷达特征不符;这些数据集还存在地域局限性。
ROVR是一家自成立之初就高度全球化的公司,其推出的TX和LC两款采集设备已在海外部署近2000台,积累了超过2300万公里的数据。这些数据主要分布在欧洲、北美和东南亚地区。TX设备通过手机相机收集道路数据,追求高覆盖度和鲜度;LC设备则集成了IMU、ADAS相机、车规级固态激光雷达和厘米级RTK服务,支持多种任务训练。ROVR预计到今年底,活跃设备总数将达到5000台,里程数据将达到6000万公里级。
ROVR的CTO Yuan Si表示,TX设备在市场上几乎找不到同等精度的同类数据源,而LC设备则是当前市面上唯一的量产激光雷达采集设备。这得益于ROVR与运营全球性RTK服务网络GEODNET的深入合作,以及借助中国供应链优势实现的LC量产。ROVR的采集者包括个人网约车司机、商用车队主和技术爱好者等,通过定向投放激励方式引导数据采集。
在海外市场,3D数据的需求一直存在但未被满足。地图公司过去提供的情报数据大多只有图片,而带有结构化信息和点云的高精地图成本过高。当前,中国车企和科技公司正在谋划辅助驾驶方案出海,面临中外道路差异带来的适应成本。ROVR提供的数据包以30秒覆盖约1公里为例,成本仅为传统数据的十分之一。
ROVR团队在自动驾驶、地图和互联网大厂拥有丰富的经验,使得他们在硬件和数据产品设计方面具有优势。第一批采集硬件自今年4月发货以来,在全球市场恶劣环境下使用,无一例返修案例。ROVR还自研了数据脱敏、自动化标注等主要算法。除了继续提高两款产品的发货量外,ROVR还在研发针对室内的机械臂产品,预计将于今年底或明年初发布,这将拓展其数据产品至室内领域,并从辅助驾驶迈向具身智能。