在人形机器人领域,特斯拉Optimus与波士顿动力的Atlas常常被置于聚光灯下,成为对比讨论的焦点。近期,一种观点逐渐兴起,认为完全拟人化设计或许并非必要,甚至可能成为一种限制,特别是当Atlas展示出旋转关节、左右腿对称这类“反人类”设计时,不少人将其视为“更先进的第一性原理”。然而,这种看法可能存在偏差。
人形机器人设计的核心逻辑,应围绕“人”展开,而非单纯追求技术上的突破。特斯拉Optimus坚持完全拟人设计,并非马斯克对人类形态情有独钟,而是基于成为“通用人形机器人”的目标,其首要应用场景正是人类世界。人类日常使用的工具、所处的空间、遵循的动线以及操作的界面,无一不是为人类自身量身定制。门把、方向盘、楼梯、座椅、开关、货架等,这些都不是为“可旋转关节”或“对称双腿”的机器人而设计。Optimus的类人结构,本质上是为了与现有环境实现无缝适配。
相比之下,Atlas的设计更像是为实验室和工厂量身打造的最优方案。在特定任务中,如搬箱子、旋转身体,Atlas能够展现出极高的效率。但若让它去完成开普通汽车、操作标准机床,或在狭窄居家环境中端茶倒水等任务,其“反人类”的结构以及高昂的维修难度,反而会成为阻碍。拟人并非简单的模仿,而是追求“兼容性”。反对Optimus的人常以“人类五根手指不是最优设计”“人类转身需要三步”等理由进行反驳,却忽略了改造全世界所有工具、空间和界面以适应新形态机器人的巨大成本。Optimus的思路是,不改变世界,只改变机器人自身,使其双手能使用现有工具,双眼视角与人相近,步态能适应现有楼梯和门槛,这种“以机器人适应人”的务实哲学,是其能够在工厂、家庭、仓库等场景快速适配落地的关键。
训练数据对于人形机器人的进化至关重要,它并非问题,而是重要的竞争壁垒。有人认为,Atlas的形态无法利用人类视频数据,但强化学习可以弥补这一不足。这种说法只看到了部分真相。强化学习确实能够提升特定任务的性能,却无法替代海量人类行为数据所蕴含的“常识”与“泛化能力”。人类每天进行的开门、搬运、避障、协作等上千种日常动作,都被记录在无数视频中。Optimus可以直接利用这些数据进行模仿学习,快速掌握在人类环境中的行动方式。而Atlas若要完成同样任务,就需要重新进行大量仿真和实体训练,时间成本、试错成本以及数据收集成本都将大幅增加。即便通过世界模型进行仿真,成本依然居高不下。
从供应链与成本角度来看,Optimus正在借鉴特斯拉在电动车领域的成功经验。有人称赞Atlas“只用两种执行器,降低成本”,但特斯拉在Optimus上有着更为长远的规划,即实现规模化、标准化、一体化。Optimus使用的执行器、传感器、芯片等,许多与特斯拉电动车共享供应链,这种“跨界复用”带来的成本降低效果,远超设计上的简化。更重要的是,特斯拉正在构建一个从硬件到软件的全栈闭环,涵盖仿真训练、数据引擎、自动驾驶技术迁移等方面。这是一种系统级的降本路径,而非仅仅在关节设计上进行取舍。从车辆的“感知 - 预测 - 规划 - 控制”到机器人的“视觉 - 场景理解 - 动作规划 - 关节控制”,特斯拉构建了统一的多模态决策网络,使Optimus能够像自动驾驶系统一样,在动态环境中实时做出长序列任务分解与运动规划。
在讨论人形机器人落地的过程中,情绪价值与接受度是不可忽视的因素。机器人最终要走进家庭、医院、商场等场所,与人类亲密接触。一个外观和动作都像人的机器人,无疑更容易被人类接受。Optimus的柔和线条、拟人步态、自然手势,并非多余的装饰,而是降低人类抵触心理、促进协作的重要设计。而Atlas的“台灯头”和机械旋转动作,在工厂环境中或许可行,但在幼儿园、养老院、零售店等场所,恐怕难以被大众接受。Optimus的目标是成为“通用人形机器人”,而Atlas更像是一个“特种机器人”,在特定任务上表现出色。Optimus并不追求在单一任务上做到极致,而是致力于在人类世界中实现全能。
特斯拉Optimus的真正价值,不在于其外观是否像人,而在于能否“用人类所用、代人类劳作”。它代表的不仅仅是一台机器人,更是一套可扩展、可训练、可量产的生产力系统。就像智能手机,它并非相机中最专业的,也不是音乐播放器中音质最好的,但却凭借最兼容、最便携、最全面的特性,成为人们生活中不可或缺的设备。特斯拉Optimus正沿着这样一条道路前行,不过度设计,不标新立异,而是以最接近人类的形态,去做最能融入人类世界的事情。










