在近期举办的青年科学家成果转化与具身智能高质量发展研讨会上,北京大学助理教授及银河通用机器人创始人王鹤博士分享了他的独到见解。他指出,自动驾驶技术的飞速进步得益于海量的真实数据支撑,然而具身智能的发展路径却截然不同,合成数据将成为其突破的关键。
银河通用机器人在技术创新上迈出了重要一步。今年年初,公司推出了全球首个端到端具身抓取基础大模型GraspVLA,这一模型无需依赖大规模的真实数据,仅凭合成数据即可完成预训练过程,为具身智能的发展开辟了新的道路。紧接着,在6月份,银河通用又发布了面向零售商业化的端到端大模型GroceryVLA以及产品级端到端导航大模型TrackVLA,进一步丰富了其技术矩阵。
王鹤博士强调,自动驾驶领域的数据采集相对容易,因为车辆在路上行驶时就能不断产生数据。然而,具身智能的数据采集却面临巨大挑战。目前,全球最大的具身智能数据采集量仅能达到百万条级别,远远无法满足模型训练的需求。以银河通用为例,尽管今年的量产目标超过1000台人形机器人,但要达到1亿条真实数据的采集量仍然遥不可及。
针对这一难题,王鹤博士提出了利用大规模合成仿真数据来弥补真实数据不足的策略。他认为,这是当前破局的关键所在。当然,他也展望了未来,当人形机器人的市场占有率达到类似汽车的规模时,采集成本将大幅下降,真实数据将成为不可或缺的重要资源。
在机器人的规模化应用方面,银河通用取得了显著的进展。特别是在智慧零售领域,公司推出了全球首个人形机器人智慧零售解决方案。该方案由轮式双臂机器人Galbot全天候在无人店铺内执行自动化全流程,包括盘点、补货、取送、打包等,极大地提高了零售效率。目前,银河通用已在北京常态化运营了约10家24小时无人值守智慧药房,并计划在国内布局100家智慧零售店。
王鹤博士还透露,银河通用正在将GraspVLA(专注于上半身操作)、TrackVLA(专注于下半身导航)以及人机交互等技术融合成一个基座大模型——GALBOT VLA。这一模型将很快在零售、工业、康养、迎宾接待等一系列场景中实现应用落地,为具身智能的未来发展注入新的活力。