在近期举办的GTC2026大会上,宇树科技创始人兼首席执行官王兴兴向与会者分享了公司在具身智能领域的最新技术突破,并深入探讨了该领域在任务泛化能力、数据利用效率及强化学习规模效应等方面面临的挑战。他指出,尽管具身智能已成为全球科技界关注的焦点,但要实现真正意义上的突破仍需跨越多个技术门槛。
王兴兴认为,当前具身智能发展的核心障碍在于缺乏具备强泛化能力的模型,这类模型需能在完全陌生的环境中稳定执行多样化任务。他预测,这一技术临界点有望在未来一至三年内实现。他特别强调,机器人的运动能力与实际应用能力必须同步提升,其中运动能力是执行复杂任务的基础前提。只有具备丰富的动作表达和高度稳定性,机器人才能真正进入工厂、家庭等实际场景。
据介绍,宇树科技自2016年成立以来,已推出多款具有行业影响力的人形机器人产品。2024年发布的小尺寸人形机器人G1凭借其紧凑设计、高性价比和完善的传感器配置,成为全球范围内广受认可的经典机型。该公司后续推出的中型工业级机器狗和大尺寸人形机器人H1,分别在巡检作业和体力型工作场景中展现出强大性能。近期发布的小型机器狗As2则具备防水能力和长续航特点,可承载十余公斤负重,在户外活动场景中具有广泛应用潜力。
在技术突破方面,宇树科技通过持续优化自动化控制系统,显著提升了机器人的抗冲击能力和自主恢复能力。其人形机器人H1已实现1500米长跑能力,并在任意动作干扰恢复、全身遥操作等关键技术领域取得重要进展。王兴兴透露,公司开发的预训练全身强化学习模型,使机器人能够灵活切换复杂动作组合,这一技术突破在2026年春晚机器人表演中得到了充分验证。当时参与演出的机器人通过改装激光雷达和优化集群控制系统,成功完成了醉拳、舞剑等高难度动作组合。
针对具身智能发展的关键瓶颈,王兴兴提出三大解决方案:首先需提升模型对任务的动作表达能力,通过改进多模态感知系统和编码解码器架构突破泛化限制;其次要建立高效的数据利用体系,在预训练阶段充分整合视频、仿真和互联网数据,减少对真实机器人数据的依赖;最后需构建可复用的强化学习框架,通过数据积累形成规模效应。他特别指出,当前行业普遍存在的"单任务训练"模式导致数据利用率低下,建立统一的数据复用机制将成为技术突破的关键。
在技术路线选择上,王兴兴看好世界模型与视频生成模型的发展潜力。他认为这类模型能够充分利用互联网海量数据资源,具有更高的技术天花板。宇树科技去年开源的视频生成世界模型,通过"想象-对齐-执行"的三阶段架构,已在动作预测精度方面取得显著进展。尽管视频模态与真实执行存在毫米级误差挑战,但王兴兴认为将视频生成与强化学习相结合,将是实现技术突破的有效路径。
对于具身智能的"ChatGPT时刻",王兴兴给出了具体定义:当机器人能在80%的陌生场景中,仅通过语言指令完成80%的任务时,即标志着该领域实现质的飞跃。他特别强调,这种能力必须建立在零重新训练、零数据采集和零环境部署的基础上。虽然实现这一目标存在技术偶然性,但任何突破都将对整个行业产生深远影响。他呼吁全球科研机构和企业加强合作,共同攻克具身智能领域的技术难题,推动机器人技术向更高水平发展。











