滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

李飞飞团队突破具身智能瓶颈：触觉独立通道让机器人“感知”世界

时间：2026-07-05 16:54:42 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

机器人领域正经历一场认知革命。当行业普遍将多模态数据视为通往通用智能的钥匙时，一支跨国研究团队用一组反常识的实验数据，撕开了具身智能发展路径上的隐秘裂缝。他们发现，将触觉信号强行注入视觉主导的模型架构，不仅没有提升操作精度，反而导致任务成功率从17%暴跌至6%。这个看似荒诞的结果，实则暴露出整个领域长期忽视的感知模态匹配难题。

实验采用的π0.5模型堪称行业标杆，其架构设计遵循着"感知即融合"的黄金法则。研究团队仅添加了触觉传感器数据，却意外触发系统崩溃。深入追踪发现，视觉信号以每秒5帧的节奏更新，而触觉反馈需要每秒20次以上的采样率才能捕捉压力变化。这种时间尺度的根本差异，使得高频触觉数据在低频Transformer架构中沦为噪声，最终导致视觉表征与触觉反馈相互干扰。

面对这个结构性矛盾，科研人员构建了全新的T-Rex框架。该系统创造性地采用混合专家架构，将控制权分配给三个独立模块：潜在专家以视觉语言数据构建场景预测，动作专家在低频维度生成基础运动轨迹，触觉专家则在接触瞬间以毫秒级响应进行精细调整。这种设计让不同感知模态在各自适用的时间尺度上独立运行，仅在决策层进行信息融合。

技术突破的关键在于时空触觉编码器的发明。研究团队开发的VQ-VAE模块能将连续力信号转化为离散"触觉词汇"，既保留动态变化特征，又过滤传感器噪声。配合专门构建的触觉数据集——涵盖200种日常物品与22种基础动作的100小时同步记录——使得模型能够学习通用的触觉-动作映射关系，而非死记硬背特定场景的解决方案。

训练策略同样体现分层智慧。系统首先通过22,889小时的人类操作视频建立运动先验，再用机器人触觉数据进行跨模态对齐，最终通过少量示范数据激活专项能力。这种渐进式学习使触觉模块得以"嫁接"在成熟的视觉运动框架上，显著降低数据依赖度。在翻书页、转移生鸡蛋等12项精细操作测试中，新系统较基线模型取得超过30%的平均成功率提升。

消融实验进一步验证设计合理性。当移除触觉输入时，系统性能出现断崖式下跌；若强制触觉降频同步视觉，操作精度同样显著下降。这些结果证明，T-Rex的成功源于对感知模态特性的深度理解——触觉需要独立的高速处理通道，而非简单堆砌数据维度。

这项研究正在重塑具身智能的技术范式。传统将所有感知塞进单一Transformer的"万能公式"，在涉及物理交互的场景中显露出根本缺陷。触觉作为快变量，其处理逻辑与视觉语言等慢变量存在本质差异。正如神经科学中的双流假说所示，生物系统早已将"识别"与"操作"分离处理，T-Rex框架实质上是在机器人领域复现了这种演化智慧。

当前技术仍存在局限。对于需要数秒级连贯动作的复杂任务，示范数据的覆盖度仍显不足；全手掌触觉感知与传感器标定等工程难题也有待突破。但这些挑战无法掩盖范式转变带来的启示：真正的物理智能，需要为不同感知模态构建专属的处理通道，让机器人既能"看"懂世界，更能"摸"透世界。

更多>同类资讯

LG Display借AI之力革新：缩短研发周期，年省成本超2000亿韩元

07-05

新规下智能体赛道生变：关系型智能体告别野蛮生长时代

07-05

从香农夫妇的猜字母实验，看大语言模型背后的预测与压缩逻辑

07-05

Anthropic再突破！Claude Tag让AI成为团队协作“正式员工”

07-05

Codex与ChatGPT合并背后逻辑何在？OpenAI团队负责人揭秘未来方向

07-05

OpenAIScaling Law被指存致命漏洞：全球AI行业算力错配浪费巨大

07-05

Fedora“AI桌面”计划遇阻：社区反对声浪下项目无奈搁浅

07-05

前5月国产机器人出口近200亿，品类多元，为高端制造出海添强劲动力

今年以来，我国机器人出口规模持续扩大，品类结构不断优化，为高端制造出海注入新动能。各类单独列名的机器人合计出口1037.7万台，出口总值达199.9亿元，产品远销全球150多个国家和地区。依托自主导航、自动集…

07-05

宝安自变量机器人牵手深圳文旅共筑“科技+文旅”新范式西人工岛先行先试

双方将依托各自核心优势，围绕深圳全域文旅资源，在文旅场馆、深中通道西人工岛展厅、餐厅咖啡店、VR体验店、研学室、文博场馆、酒店及交通枢纽等场景全面展开合作，共同打造“科技+文旅”融合标杆，助力深圳建设全球领…

07-05

无网络无调度无中心通信清华水面微型机器人集群演绎群体智能新篇

清华大学的最新硬核成果——水面微型机器人集群，彻底颠覆了传统机器人的协作逻辑：这群机器人丢在水里，在没有网络、无人调度、无中心通信的状态下，仅靠简单的环境感知，就能够自发协同完成一系列任务，比如推送重物、搭建…

07-05

今年前5月我国机器人出口成绩亮眼清洁及工业等机器人海外“圈粉”无数

07-05

LG Display借AI发力：虚拟验证缩短研发周期，年省成本超2000亿韩元

07-05

魏县特种车辆零部件集群：共享模式破困局降本增效促发展

07-05

丰田启动术语整合计划：AI助力2028年前将4.5万术语精简至5000套

07-05

LG Display用AI降本，每年可省超2000亿韩元

07-05

点击查看更多 +

全站最新

乐道OrinX纯视觉车型智驾迎大升级 Coconut 3.1.0版本7月将推送至16万用户

MG07设计引争议，陈萃坦言“抄”自家老车，是传承致敬还是另有隐情？

手机厂商AI竞速：有人押注云端大脑，有人布局机器人未来

保时捷北京品牌空间启幕：从经典356到个性定制，解锁跑车文化新体验

星条旗元素加持日产锋坦Frontier 250周年纪念版限量来袭

昊铂埃安：BU制改革赋能，销量结构双优构建增长新范式

热门内容

本栏最新

丰田启动术语整合计划：AI助力2028年前将4.5万术语精简至5000套

天马全球首推3.16英寸Micro LED透明圆屏车载显示全场景布局再升级

安波福多管齐下应对芯片紧缺：优化架构、双轨备份保汽车供应链稳定

预售来袭！领克07GT高颜值猎装，408马力起，续航破千，配置超丰富

通信网络新变革：AI赋能，Token驱动，开启智能时代新篇章

魏县特种车辆零部件集群“共享智造”：降本增效助力企业“抱团”发展

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.