ITBear旗下自媒体矩阵:

上海发布全球最大“视触觉”数据集 助力机器人突破感知瓶颈迈向精细操作

   时间:2026-01-28 04:13:21 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

具身智能领域迎来重大突破,全球首个“视触觉”多模态机器人操作数据集——白虎-VTouch在上海正式发布。这一数据集不仅规模庞大,更以模态完整、任务结构系统化著称,标志着具身智能机器人正从“视觉感知”向“触觉与控制”的精细化操作阶段迈进,为解决传统机器人“看得见、摸不着”的感知瓶颈提供了关键技术支撑。

长期以来,具身智能的语料数据主要依赖视觉传感器,导致机器人在理解世界时过度依赖“看”,而缺失了触觉这一重要维度。这种感知不平衡使得机器人在暗光环境操作、抓取易碎物品等复杂场景中表现欠佳,难以完成需要高精度触觉反馈的任务。白虎-VTouch数据集的发布,正是为了填补这一空白,通过整合触觉与视觉数据,为机器人构建更全面的物理世界认知模型。

该数据集由国家地方共建人形机器人创新中心与上海纬钛科技有限公司联合研发,核心目标是提供触觉与接触的缺失数据,为具身基础模型提供关键语料和工程基础。数据集不仅包含深度彩色图像(RGB-D)和关节位姿数据,还通过纬钛科技自研的视触觉传感器,记录了软接触、硬接触、滑动接触等多种物理交互模式下的压力和形变数据。目前,数据集总量已超过6万分钟,涵盖约9072万对视触觉图像与真实物体接触样本,规模居全球首位。

在数据采集方法上,白虎-VTouch首创矩阵式任务设计,突破了传统单一任务训练的局限。这种方法不仅大幅提升了数据采集效率,还显著增强了机器人的实际应用能力。研究团队通过轮式、双足等多种机器人构型及手持终端,在家居家政、工业制造、餐饮服务、特种作业四大类场景中完成了超过380个任务类型,涉及500多种真实物品,覆盖抓取、插入、旋转、放置等100多种原子技能,基本满足90%的日常生活和工业操作需求,展现出强大的跨平台泛化能力。

为推动具身智能生态的开放发展,白虎-VTouch的首批6000分钟数据已上线开源社区OpenLoong。这一举措不仅丰富了我国具身智能的技术生态,也为全球开发者提供了构建更智能、更灵巧机器人基础模型的原创资源。随着数据集的持续完善,未来的机器人将不再局限于“移动摄像头”的角色,而是能够通过灵敏的触觉感知,像人类一样处理复杂任务,成为真正的智能助手。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version