在自动驾驶领域,小马智行CTO楼天城提出了一个引人深思的观点:驾驭AI的能力将成为这个时代的关键竞争力之一。他认为,当前的AI系统正如同脱缰野马,展现出强大的主动性和能量,甚至可能在未来将人类纳入其调用链条中。这一判断源于他对AI技术发展趋势的深刻洞察。
楼天城指出,传统的人类教练模式正在被颠覆。随着AI司机学会使用各种工具,工程师的角色将从指导者转变为执行者。这种转变迫使行业重新思考人机关系,促使小马智行推出了PonyWorld世界模型2.0。这个新模型标志着自动驾驶进入了一个新阶段:由AI主导开发、评测,并在必要时调用人类协助。
技术瓶颈、消费者期望和自动驾驶的终极目标,共同推动了这一变革。PonyWorld世界模型2.0的诞生,正是为了应对这些挑战。该模型通过自我诊断和定向进化能力,实现了开发范式的革命性转变。楼天城解释说,当AI的驾驶能力超越人类后,继续由人类指导反而可能引入错误,因此让AI自我识别和指导成为必然选择。
这一模型的核心创新在于跳过了语言这一中间环节,直接将传感器数据映射为驾驶动作。这种方法不仅减少了算力消耗,还提高了数据收集和模型精度的效率。同时,引入的"意图"语义层使AI能够像人类老司机一样,基于本能做出快速决策,而非通过复杂的语言推理。
世界模型2.0的另一个突破是定向进化能力。系统能够自动识别薄弱场景,并生成针对性的数据采集任务。这种精准的数据收集方式,与传统的广撒网模式形成鲜明对比,大大提高了研发效率。楼天城强调,即使作为AI的数据采集员,人类也需要具备驾驭AI的能力,这将成为未来人才的关键特质。
对于人类驾驶数据的价值,楼天城给出了一个大胆的判断:在AI驾驶能力超越人类后,普通人类数据对模型精度提升的价值将趋近于零。他认为,当AI明显优于人类时,人类数据可能反而会引入不良习惯。这一观点挑战了传统认知,也解释了为什么小马智行选择让AI自主生成训练数据。
在技术实现路径上,楼天城对VLA(视觉-语言-动作)路线持保留态度。他认为语言作为中间层效率低下,因为其本质是对复杂物理世界的降维投影。相比之下,小马智行选择的直接映射方法,配合意图语义层,能够更高效地捕捉驾驶场景中的关键信息。
关于自动驾驶的终极形态,楼天城认为L4级自动驾驶无法通过单纯模仿人类行为实现。他指出,模仿学习的天花板就是人类本身,而L4级自动驾驶的要求远高于人类驾驶能力。因此,强化学习和世界模型成为必然选择,这一观点现已成为行业共识。
在人机协作方面,楼天城提出了"对齐评价标准而非行为"的理念。他认为,虽然人类需要设定基本原则,但AI将在这些原则基础上进行自我扩展和优化。这种协作模式将贯穿于自动驾驶系统的各个方面,从基础研发到实际路测。
对于自动驾驶的商业化前景,楼天城表现出乐观态度。他认为,随着模型精度的提升和成本的降低,自动驾驶服务将能够覆盖更多区域和复杂场景。小马智行积累的千万公里级多城市纯无人驾驶数据,为其技术迭代提供了坚实基础。
在更广阔的AI发展图景中,楼天城认为自动驾驶只是物理AI的先锋应用。世界模型的演化将使其融入更多物理定律,为其他物理AI应用创造价值。他预测,AI将逐步从辅助角色转变为主导角色,这一趋势已经在AI编程等领域显现端倪。
面对AI时代的挑战,楼天城强调了基础能力的重要性。他认为,与其专注于特定技能的学习,不如培养数学、物理等基础认知能力,以及交流能力。在他看来,帮助AI超越人类的过程,也是理解人类独特价值的过程,这将为教育方向提供重要启示。









