全球首个城市级常态化运营的人形机器人示范区近日在北京落地,标志着具身智能技术正式走进大众日常生活。其中,由北京银河通用机器人有限公司打造的“银河太空舱”——一家完全由机器人运营的无人超市,成为焦点。这家无人超市不仅展示了机器人自主工作的能力,更在工业、零售等多个场景实现了规模化应用,引发了业界对机器人技术发展的广泛讨论。
在机器人技术快速发展的当下,一个现实问题逐渐浮现:绝大多数机器人仍依赖人工遥控或预编排程序,难以真正实现自主工作。然而,银河通用的机器人Galbot却打破了这一局限,它不仅能够摆脱遥控器,还能在复杂环境中自主完成任务。这一突破背后,是具身智能技术对数据的高度依赖——无论是从动作智能向认知智能的转变,还是提升机器人的泛化性和鲁棒性,数据的质量和数量都起着决定性作用。
银河通用创始人兼首席技术官王鹤指出,当前机器人企业在技术路线上逐渐分化。一类以宇树科技为代表,专注于机器人运动能力的展示,如舞蹈、拳击等;另一类则以银河通用为代表,更注重机器人在实际场景中的干活能力。他特别提到,许多机器人看似精彩的表演,实际上是通过遥控或视频剪辑实现的,并非真正的自主智能。
以工业场景为例,银河通用的机器人已在流水线搬运、分拣等环节实现规模化应用。在零售领域,北京海淀已有10多家配备人形机器人的智慧药房投入运营,并计划年内在全国开设100家。这些机器人还能自主售卖零食、咖啡等商品,真正实现了“无人化”服务。
针对“demo先行、落地乏力”的现象,王鹤解释说,演示视频与实际产品的差距主要体现在泛化性和硬件可靠性上。演示视频通常在受控环境中拍摄,机器人只需完成特定任务;而实际产品则需要在不同物体、环境和光线条件下稳定工作。如果机器人频繁需要人工维修,也难以大规模投入使用。
要实现机器人自主工作,关键在于具备自主执行能力的模型“大脑”和可靠的硬件性能。王鹤透露,银河通用今年初通过10亿级合成大数据,端到端训练了一个VLA大模型,使机器人能够根据视觉输入实时调整动作。6月,公司又推出了端到端导航大模型,赋予机器人“听—看—懂—走”的闭环运动能力。
在数据获取方面,王鹤提出了一个创新方案:99%的数据可通过高质量合成数据解决,仅1%需要真实遥操采集的数据。这一方案不仅降低了数据采集成本,还提高了数据的多样性。他强调,高质量数据应具备多元性,能够体现柔性物体的操作,并具备场景泛化性。
对于机器人商业落地的难点,王鹤认为,找到可批量复制的场景是关键。他预测,未来3年内,能够找到突破性场景的企业将留在竞争行列,否则将面临淘汰。同时,他指出,如果能够彻底解决抓取、移动、放置等基础操作的泛化性问题,将打开数千亿元的市场,使机器人在零售、前置仓、车厂分拣等多个场景中发挥作用。
在讨论机器人智能与人类智能的关系时,王鹤以猩猩为例,说明并非所有思维活动都依赖语言。他指出,人类的思维是一个复杂的认知过程,涉及视觉思维、空间思维、情感思维等多个方面。语言能够促进思维的传播,但思维能力、语言能力和操作能力共同构成了智能的核心。
对于“智能”的定义,王鹤给出了简洁的答案:智能就是解决问题的能力。无论是人类、动物还是机器人,遇到问题后能给出解决办法的能力,就是智能。他举例说,面对一瓶饮料,人类通过语言沟通请人打开,动物徒手打开,机器人通过精确的力控制打开——这些方式不同,但都体现了智能。