ITBear旗下自媒体矩阵:

具身智能浪潮涌动,争议与希望交织,机器人“上岗”之路怎么走?

   时间:2025-09-20 06:18:17 来源:小AI编辑:快讯团队 IP:北京 发表评论无障碍通道
 

人形机器人无疑是当下科技领域的焦点,但伴随热度而来的,是同样激烈的争议。自春晚舞台上机器人以秧歌表演引发关注后,这一领域便开启了加速发展模式:从4月机器人参与马拉松,到8月机器人运动会开幕,行业活动密集涌现。往年以大模型展示为主的WAIC展会,今年也大幅增加了机器人展区,足见其热度。

然而,表面的繁荣下,质疑声始终未断。金沙江创投朱啸虎年初直言“人形机器人是泡沫”,网友的调侃也暗含类似逻辑——视频中机器人似乎无所不能,现实中却连开门这种基础动作都难以完成。

作为具身智能的支持者,笔者在探究争议根源时发现,行业现状确实存在诸多难点。技术路线尚未统一便是首要问题:强化学习与世界模型孰优孰劣?数据与模型孰轻孰重?这些关键问题缺乏共识,导致企业各自为战,难以形成合力。

若抛开技术路线分歧,行业面临更迫切的挑战是数据匮乏。据业内人士透露,大模型实现智能涌现至少需要100亿至1万亿个Token的数据,约为模型参数的10倍以上。但当前多数研究的数据量仅数亿,最大公开数据集也不过10亿。这种“训练量不足”直接导致机器人任务种类有限、泛化能力差,如同实验室中的“胖宝宝”,一旦进入真实场景便束手无策。

数据瓶颈已成为机器人从实验室走向实际应用的关键阻碍。外滩大会上,宇树创始人王兴兴明确指出,数据问题是当前具身智能发展的主要挑战之一。以VLA模型为例,其与真实世界交互的数据严重不足,限制了模型性能的提升。

不过,将行业问题简单归结为“泡沫”未免过于武断。华为云具身智能团队负责人表示,新技术的发展必然伴随新问题,而解决这些问题需要新方法论和平台支持。云端解决方案便是其中之一。

以数据问题为例,云端生成合成数据已成为行业趋势。英伟达的Cosmos基础模型通过云端模拟物理环境生成训练数据,华为云的CloudRobo平台则更进一步:其自研的metaEngine引擎可将真实物理场景数字化,构建与现实完全一致的虚拟世界,并在此环境中生成海量第一视角数据,包括RGB图像、深度信息、时序数据等,且自动完成标注。

这种“云端训练”模式大幅降低了数据采集成本。银河通用创始人王鹤曾预测,合成数据将占据训练数据的绝大部分,且这一领域需要长期技术积累和核心能力。通过调整真实数据与合成数据的比例,机器人训练效率可显著提升,解决“没米下锅”的困境。

在训练环节,云端同样展现出优势。CloudRobo平台支持机器人在虚拟环境中通过模仿学习进行“虚拟劳动”,大幅降低试错成本,加速技能学习。这种模式突破了物理环境的限制——云端的训练进度仅取决于算力和电量,而非现实中的时间成本。例如,某云厂商可在一天内完成传统方式需要两年半的训练量。

云端训练的成果可直接应用于实体机器人。华为云展示的双臂机器人已在分光盒操作中实现90%以上的成功率,埃夫特的工业喷涂臂通过云端训练快速掌握新零件喷涂技术,乐聚的人形机器人也具备汽车产线搬运能力。

除数据问题外,云端解决方案还可应对行业标准混乱的挑战。当前,各厂商机器人系统、接口差异巨大,类似早期手机行业的“诸侯割据”。华为云提出的R2C协议旨在建立机器人领域的“Type-C”标准,支持“即插即用”。国家地方共建人形机器人创新中心、拓斯达、优艾智合等企业已加入该协议,推动行业标准化进程。

当然,云端解决方案并非万能。对实时性、安全性要求极高的场景,本地计算仍具优势。但云计算的核心价值在于处理复杂任务——如场景识别、任务规划、模型调用等,这些工作可交由云端完成,使机器人本体更轻便、成本更低,实现“云本体化”。

这一理念已得到行业认可。王兴兴在WRC演讲中提到,人形机器人本体难以直接部署大规模算力,未来需依赖分布式集群算力,即云端算力支持。华为近期发布的Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点产品,分别支持8192及15488张昇腾卡,算力规模领先全球,其发布的超节点集群最大可达百万卡,为具身智能行业提供算力保障。

技术争议的背后,是行业从实验室走向社会的必然过程。无论是云端还是本地计算,其核心目标都是推动机器人参与劳动、提升生产力。那些质疑“炒作”的声音虽指出了现实困难,但若仅聚焦于问题,难免得出悲观结论。技术的价值终需在真实场景中验证——无论是拧紧螺丝、搬运物料还是焊接缝隙,都是机器人证明自身的舞台。

具身智能的发展需要先行者构建基础设施。与其在岸边争论路径可行性,不如先铺就道路。毕竟,道路拓宽后,行业才能跑得更快、更远。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version