滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

李飞飞等顶尖学者突破困境：为具身智能触觉应用开辟全新路径

时间：2026-07-05 12:03:03 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在机器人技术领域，一场关于感知模态融合的深度探索正引发广泛关注。一支由多国顶尖学者组成的科研团队，在具身智能研究中意外发现了一个颠覆认知的现象：当为经典模型引入触觉信号后，机器人的任务执行效率不升反降，成功率从17%骤降至6%。这一反直觉结果，迫使学界重新审视多模态感知的融合策略。

传统研究范式认为，将视觉、语言、触觉等多元感知信息统一编码后输入大模型，能够通过数据量的累积实现智能涌现。但实验数据显示，这种"大锅烩"式的融合方式在涉及精细操作的场景中表现惨淡。研究人员通过频谱分析发现，视觉信号以每秒5帧的速率更新，属于典型的"慢感知"模态；而触觉反馈包含压力、形变等动态信息，需要每秒20次以上的采样频率才能有效捕捉。当两种时间尺度差异巨大的信号在低频Transformer中竞争算力时，触觉的高频优势被严重抑制，反而干扰了视觉表征的稳定性。

针对这种结构性矛盾，研究团队提出混合专家架构（Mixture-of-Transformers），为不同感知模态构建独立处理通道。该架构包含三位分工明确的"专家"：潜在专家负责整合视觉与语言信息，预测场景演变趋势；动作专家以每秒5次的节奏生成基础运动轨迹；触觉专家则在接触瞬间启动，以毫秒级精度修正操作力度。这种异步协作机制确保各模态在专属时间尺度下运行，避免频率错配导致的性能损耗。

为使触觉信号处理更具鲁棒性，团队开发了时空触觉编码器。该模块通过VQ-VAE技术将连续力数据压缩为离散"触觉词汇"，既能保留动态变化特征，又能抵抗传感器噪声干扰。在数据构建方面，研究团队突破传统任务导向的采集方式，创建了包含200余种日常物品、22种基础动作的同步数据集。通过排列组合生成7700余条运动轨迹，使模型能够学习通用的触觉-动作映射关系，而非记忆特定任务模板。

训练策略采用分层递进模式：首先利用2.2万小时人类操作视频进行预训练，建立基础的手部交互认知；随后通过100小时机器人触觉数据实现跨模态对齐；最终仅需少量任务示范即可完成功能微调。这种渐进式学习方式显著降低了触觉数据需求，使模型在保持视觉理解优势的同时，获得精准的触觉反馈能力。

在包含翻书页、转移生鸡蛋、分拣麻将等12项精细操作任务的测试中，新架构展现出卓越性能。相较于基线模型，平均任务成功率提升超过30%，特别是在需要力度精确控制的场景中，表现从"难以使用"提升至"具备实用价值"。消融实验进一步验证了设计合理性：移除触觉通道或强制同步运行，均会导致性能显著下降，证明异步处理机制是成功的关键因素。

这项研究对具身智能发展具有重要启示：不同感知模态具有本质差异，简单堆砌数据量并非最优解。视觉擅长全局场景理解，触觉则专注于即时物理交互，二者需要独立的处理通道与协作机制。这种设计理念与神经科学中的双流假说不谋而合——视觉系统通过腹侧通路识别物体，背侧通路指导动作，而混合专家架构在机器人身上实现了类似的功能分工。

当前研究仍存在局限性：复杂长程操作受限于示范数据覆盖度，全手掌触觉感知与传感器标定等问题有待突破。但这些技术挑战不影响其范式价值——该研究通过实证表明，触觉不应是视觉的附属品，而应作为独立感知通道与视觉形成互补。当机器人学会用"手"感知世界时，具身智能的发展或将迎来新的突破口。

更多>同类资讯

LG Display借AI之力革新生产研发，年省成本超2000亿韩元再攀高峰

07-05

AI浪潮下美术评论：以人类智慧凝萃艺术之美的新探索

07-05

前5月国产机器人出口规模攀升清洁机器人领跑全球市场新赛道

07-05

北大团队发布全球首款忆阻器神经动力学芯片突破实时计算瓶颈助力脑科学研究

07-05

宇树科技陈立：核心零部件自研自产，机器人出货量领先全球

07-05

Midjourney与好莱坞影业法律战升级：要求制片厂全面披露AI使用详情

07-05

二手FANUC焊接机器人怎么选？掌握五大要点，精准匹配生产需求不踩雷

谈判前，准备好这份询价/考察清单，让你胸有成竹：1. 要求提供设备清晰铭牌照片、原厂型号（如M-10iD/12）及详细配置清单；2.索要关键轴（通常1、2、3轴）减速机的运行时间或更换记录；3. 要求在现…

07-05

天马全球首推3.16英寸Micro LED透明圆屏车载显示全场景布局再升级

07-05

AI改写亲密关系：万元到百万元的伴侣机器人，能填补人类情感缺口吗？

07-05

安波福多管齐下应对芯片难题：全球调配资源优化架构降依赖

07-05

北京人形机器人创新中心响应倡议：以科技向善引领产业高质量发展

07-05

文物安全新守护者！国内首颗文物遥感卫星升空开启智能监测新篇

卫星核心工作并非直接探测地下文物，而是持续监控文物保护区周边环境变化，监测内容覆盖四大板块：一是盗掘、违规施工等人为破坏活动；二是滑坡、沉降、风沙水蚀等自然地质灾害；三是能够反映人为扰动的植被异常区域；四是…

07-05

银行业AI转型加速：大行稳进、股份行竞速、民营行深耕小微普惠

07-05

安波福多管齐下应对芯片紧缺：优化架构、双轨备份保汽车供应链稳定

07-05

预售来袭！领克07GT高颜值猎装，408马力起，续航破千，配置超丰富

07-05

点击查看更多 +

全站最新

夏日消费热潮涌动各地消费者乐购新能源汽车智能家电等好物

鸿蒙智行享界G9尾部无伪装实车照流出，侧开门后备箱+全新设计尾灯引关注

柴油豪华轿车“三雄对决”：Giulia、3系、C级谁更能诠释驾驶真谛？

换轮胎一定要四条全换？汽修老师傅揭秘换胎规则，车主看完少花冤枉钱

MG陈萃“自曝抄袭”引热议：抄自家历史设计，是传承还是争议？

俄罗斯燃油短缺催热新能源市场中国电动车受青睐插混车销量激增

热门内容

本栏最新

天马全球首推3.16英寸Micro LED透明圆屏车载显示全场景布局再升级

安波福多管齐下应对芯片紧缺：优化架构、双轨备份保汽车供应链稳定

预售来袭！领克07GT高颜值猎装，408马力起，续航破千，配置超丰富

通信网络新变革：AI赋能，Token驱动，开启智能时代新篇章

魏县特种车辆零部件集群“共享智造”：降本增效助力企业“抱团”发展

iCAR V27大版本OTA升级：HSD V2.0赋能，智驾座舱全面进化

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.