近期,北京亦庄迎来了备受瞩目的世界机器人大会,此次盛会于8月8日至12日举行,以“智慧机器人,智能具身体”为主题,汇聚了全球200多家顶尖机器人企业,人形机器人领域的参展企业数量更是刷新了同类展会的全球纪录。
大会期间,宇树科技创始人兼CEO王兴兴作为码荟成员企业的代表,发表了主旨演讲,分享了对全球机器人行业最新趋势的独到见解。
王兴兴指出,今年上半年,机器人行业因市场需求旺盛及政策的大力支持,迎来了前所未有的增长热潮。整机厂商与零部件厂商普遍实现了50%至100%的增长率,这种幅度的增长在整个行业中极为罕见。
在海外市场,特斯拉作为行业先锋,计划今年量产数千台人形机器人,并即将发布第三代Optimus,这一动态无疑值得业界高度关注。英伟达、苹果、meta、OpenAI等国际巨头也纷纷布局机器人领域,推动了行业的快速发展。
王兴兴进一步分享了对机器人本体发展的看法。他认为,当前机器人未能大规模应用、功能尚不完善,并非硬件不足或成本过高所致。从技术层面来看,现有的硬件条件已足够支持机器人的基本运作,关键在于量产及工程化过程中遇到的诸多挑战。然而,最大的瓶颈在于具身智能的发展,即AI技术尚未达到满足机器人广泛应用的需求。
他类比了ChatGPT的崛起,指出在ChatGPT出现之前,语音AI技术虽已发展多年,但始终未能达到令人满意的水平。而ChatGPT的出现,则标志着AI技术跨越了一个临界点,实现了超越人类平均水平的能力。王兴兴认为,人形机器人也亟待这样的临界点,即能够在陌生环境中自主完成复杂任务的能力。
关于具身智能的发展瓶颈,王兴兴认为,当前的主要问题不在于数据,而在于模型架构。尽管大语言模型领域的数据驱动方法取得了显著成效,但在具身智能和机器人领域,数据的质量和利用效率却成为难题。他提到,VLA模型等现有架构在与真实世界交互时存在局限性,需要更加先进和统一的模型架构。
在分享宇树科技的技术探索时,王兴兴提到了谷歌的视频生成模型和OpenAI的视频生成技术。他认为,通过视频生成模型控制机器人执行任务的技术路线具有潜力,可能比VLA模型更快收敛。然而,这一技术也面临着GPU消耗过大等问题。
王兴兴还强调了机器人强化学习(RL)扩展定律的重要性。他指出,目前机器人在学习新技能时仍需从头开始训练,效率低下。而强化学习在语言模型上已得到验证,但在机器人运动控制上仍处于起步阶段。因此,他预计在未来2至5年内,智能机器人技术的重心将放在端到端的具身智能AI模型上。
除了模型架构的改进,王兴兴还提到了硬件成本和寿命的重要性。他指出,随着人形机器人市场的扩大,低成本、高寿命的硬件将成为关键。同时,大规模、低延迟的分布式算力也将成为机器人行业未来发展的重要支撑。他设想,在工业领域,工厂可以部署分布式服务器,让机器人直接连接局部服务器,以降低通信延迟并提高安全性。而在居民小区,则可以建立分布式集群算力中心,为机器人提供算力支持,降低用户成本。
最后,王兴兴强调了全球共创在AI和机器人领域的重要性。他认为,没有哪家公司能保证永远领先,AI的创新需要更多聪明年轻人的参与和全球企业的共同努力。