ITBear旗下自媒体矩阵:

ICRA 2026:具身智能2.0时代,它石智航如何解锁全栈能力新突破?

   时间:2026-06-05 20:17:40 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在维也纳举办的ICRA展会上,来自全球的机器人企业齐聚一堂,展示着具身智能领域的最新突破。三年前还停留在概念阶段的具身智能,如今已演变为能够自主行动的实体机器人。然而,热闹的表象下,行业正面临关键挑战:尽管机器人已具备基础运动能力,却难以在真实场景中创造价值,技术和商业闭环尚未形成。当前,只有少数企业掌握了模型、硬件与数据协同发展的核心能力,多数产品仍停留在具身智能1.0阶段。

如何推动具身智能进入2.0时代?某科技公司通过完整技术链路的实践提供了参考。这家两个月前完成行业最大单笔融资的企业,在ICRA展会上同步发布了从人类行为数据采集系统、AWE 3.0模型到高自由度灵巧手的整套解决方案。其技术展示聚焦于机器人本体与复杂任务的执行能力,引发业界对全栈技术竞争力的讨论——当行业进入深水区,单一技术优势已不足以支撑发展,系统化能力成为关键。

该公司首席科学家在接受专访时指出,具身智能的代际跃迁本质是技术范式的革新。2023-2024年的萌芽期,企业主要聚焦机器人本体制造与小规模模型探索;2024年兴起的VLA范式通过遥操作采集数据,虽实现基础泛化能力,但受限于场景特定性。当前进入的2.0时代,以人类行为为中心的数据采集方式成为主流,配合世界动作模型(World Action Model)的架构升级,使系统具备更强的可扩展性。预计到2027年,引入世界模型驱动的后训练机制将开启3.0时代,届时机器人将同时具备泛化能力与场景生产力。

针对企业停滞在1.0阶段的现象,专家分析指出,技术范式转型的惯性是主要障碍。尽管人类行为中心的理念逐渐被接受,但部分企业仍对数据采集设备的工程化难度估计不足。以该公司为例,其提前布局的SenseHub可穿戴设备,通过多传感器时空同步技术,实现了毫米级动作精度捕捉,这种从硬件到算法的全栈优化能力,构成了技术代际跨越的护城河。

在商业化路径选择上,该公司采取"聚焦垂直场景"策略。以线束柔性装配场景为例,该场景要求机器人完成毫米级精度的孔位插入、连续布线及缠胶等复杂工序,相当于制造汽车的"神经系统"。选择此场景不仅因其用工需求大、技术门槛高,更关键的是长程任务特性能够持续反哺基础模型迭代。现场演示的线束操作系统,已实现多根线缆的端到端自主作业,过程中具备自主纠错能力,插入精度达到亚毫米级。

模型架构创新方面,AWE 3.0模型通过统一语言、视觉、动作三种模态的训练范式,突破了传统VLA模型的数据割裂问题。传统方案中,易规模化的文本数据与稀缺的机器人操作数据形成严重失衡,导致泛化能力实质上来自语言模型而非机器人本体。新模型通过吸收跨本体视频数据,在预训练阶段即建立动作与后果的关联机制,使系统具备更强的场景适应力。针对世界模型普遍存在的"幻觉"问题,该公司通过3D隐空间建模技术,显著提升了空间感知的一致性。

数据战略成为竞争核心。该公司每日采集的有效数据规模处于行业领先地位,但强调数据质量优于数量。对于线束等高精度任务,全部采用人类操作数据以确保精度;对于亚厘米级任务,则混合使用机器人采集数据。这种分层策略使通用模型预训练仅需50万小时人类数据,而单任务适配数据量可控制在1小时以内。针对数据跨境流通问题,专家认为受隐私法规限制,全球化数据共享短期内难以实现,本地化数据采集将成为主流。

在感知技术前沿,该公司发布的TacForeSight视触觉融合系统,将模型反应频率提升至百赫兹级别。通过预判接触状态变化,该系统在试管操作、动态擦洗等任务中表现出色,成功率超过80%。另一项空间感知研究成果则解决了视角变化导致的操作精度下降问题,使模型具备新视角想象能力,在30度视角扰动下仍能保持高成功率。

学术合作方面,该公司在ICRA发表9篇论文,并与国内顶尖高校建立人才联合培养机制。对于行业发展趋势,专家预测2025-2026年将出现操作能力重大突破,Zero-Shot和Few-Shot学习能力显著提升。同时警告行业竞争将加剧,技术规模化需要持续投入,头部效应会愈发明显。当被问及3.0时代标准时,其认为机器人需在多个细分领域展现超越人类的生产效率,虽未达到通用人工智能,但应形成显著的技术优势壁垒。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version