人形机器人正从实验室迈向更广阔的应用场景。从特斯拉Optimus进入工厂作业,到搭载脑机接口技术的康复机器人投入使用,再到上纬启元推出首款可“二次开发”的个人机器人Q1,这些创新产品标志着人形机器人开始深度融入科研、创作和家庭生活等领域。市场研究机构IDC预测,2025年全球人形机器人市场将进入快速增长期,文娱商演、科研教育、工业制造、仓储物流等场景将成为主要需求方向。
随着应用场景不断拓展,数据瓶颈成为制约具身智能发展的关键因素。与自动驾驶和通用大模型不同,人形机器人需要记录在真实物理世界中完成接触、施力、协同等动作的全过程数据。这类数据不仅采集成本高昂,且标注复杂度远超传统数据类型。上海某科研机构负责人指出,仅依赖公开视频或仿真数据无法捕捉触觉、接触力等关键物理信息,机器人难以通过视频学习如何精准施力。
行业正通过构建高质量数据集突破这一困境。国家地方共建人形机器人创新中心联合上海纬钛科技发布的“白虎-VTouch”数据集,成为全球首个大规模跨本体视触觉多模态数据集。该数据集包含视触觉传感器数据、RGB-D数据和关节位姿信息,覆盖轮臂机器人、双足机器人及手持终端等多种构型,数据规模超过6万分钟。其创新之处在于采用“矩阵式”任务设计,从双臂协同结构、原子操作类型、接触模式三个维度构建了380余种任务类型,涵盖家居、工业、餐饮等四大类场景。
数据质量与结构的重要性引发行业深度思考。傅利叶CEO顾捷提出,单纯追求数据规模意义有限,真正有价值的数据应包含不同任务间的切换过程以及成功与失败的完整记录。他建议构建“三明治式”数据结构:以公开视频作为基础层,补充人类第一视角的操作数据,再叠加少量高价值的机器人实采数据。这种模式既能降低采集成本,又能确保数据反映真实操作意图。
数据竞争正推动技术生态向底层延伸。多模态传感器和视触觉融合技术的突破,使物理交互数据采集成为可能;与此同时,数据格式标准化、标注体系统一化的需求日益迫切。库帕思与它石智航近期宣布合作推进具身数据标准建设,傅利叶则联合医疗机构发起“脑机具身·数据引擎联合创新计划”,尝试在康复场景中打通脑机接口与具身智能的数据闭环。这些举措标志着行业开始从技术竞赛转向生态共建。











