清华团队打造BiManiBench：为机器人双臂协作能力评估立新标尺

时间：2026-02-25 21:16:28 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当人类厨师熟练地用双手处理食材时，看似简单的动作背后隐藏着复杂的神经协调机制。这种与生俱来的双臂协作能力，如今成为人工智能领域最具挑战性的课题之一。清华大学联合香港多所高校及北京人形机器人创新中心，在机器人双臂操作能力评估领域取得突破性进展，其研发的BiManiBench测试系统为评估机器人双手协作能力建立了全新标准，相关成果已发表于学术预印本平台。

研究团队通过系统分析发现，现有AI模型在处理双臂协调任务时存在显著短板。尽管多模态大模型在语言理解和图像识别方面表现优异，但当需要同时控制两个机械臂完成抓取、传递、组装等动作时，即便是最先进的模型也频繁出现失误。这种现象类似于人类中的"左撇子"与"右撇子"在协调双手时的天然差异，但机器人面临的是更复杂的空间计算和实时反馈问题。

该测试系统构建了三级评估体系：基础层考察空间推理能力，要求机器人根据物体位置选择最优手臂；中间层测试任务分解能力，需将复杂操作拆解为可执行的步骤序列；最高层则聚焦精确控制，要求机器人同时输出16维连续动作指令，控制两个7自由度机械臂完成协同操作。这种分层设计使评估体系既能检测基础能力，又能识别高级协调缺陷。

在测试过程中，研究团队对30余个主流AI模型进行了全面评估，涵盖闭源和开源系统。实验数据显示，在基础空间推理任务中，表现最佳的模型准确率可达95%，但随着任务复杂度提升，成功率显著下降。特别是在需要精确时序控制的堆叠任务中，即使最先进的模型成功率也不足67%，而开源模型普遍低于30%。这种性能断层暴露出当前AI架构在处理多肢体协调时的根本性局限。

评估机制的创新体现在评分系统的设计上。针对传统二元评分法的局限性，研究团队开发了高斯加权空间评分模型。该系统根据物体与中心线的距离动态调整评分权重，当物体位于中央区域时，系统对左右手选择的容错率提高30%。这种设计更符合人类实际操作中的模糊判断，避免了因微小位置偏差导致的误判。

为解决机器人视野遮挡问题，测试系统引入了多视角观察机制。通过同步处理第一人称视角的精细图像和第三人称视角的全局监控，模型能获得更完整的场景信息。但实验发现，这种多模态输入对计算资源要求较高，部分中小规模模型在处理多视角数据时反而出现性能下降，这为后续模型优化提供了重要参考。

在动作执行策略方面，研究团队提出了自适应截断机制。该系统根据任务类型动态设定最大连续动作数，当执行到预设阈值时强制暂停，要求机器人重新观察环境后再继续操作。这种"安全缓冲"设计使任务完成率提升22%，特别是在涉及动态物体的操作中，有效减少了因环境变化导致的失误。

深度错误分析揭示了不同模型的特性差异。以GPT-5和Gemini-2.5-Pro为例，前者在感知阶段错误率较高，常出现物体定位偏差；后者则在规划阶段问题突出，容易产生双手动作冲突。这种差异化表现提示研究者，提升双臂协调能力需要针对不同模型架构开发专属优化方案。

测试任务设计紧密结合实际应用场景，包含双手搬运、工具使用、物品排序等23类日常操作。在模拟厨房环境中，机器人需要完成"一手持碗一手倒水"的精细动作，这项任务使85%的测试模型出现液体洒落。这类贴近现实的测试场景，为评估机器人实用化程度提供了可靠依据。

技术突破体现在多个创新模块的集成。研究团队开发的视觉驱动智能体框架，能将复杂操作分解为可执行的子任务序列；操作臂分配反馈机制可在手臂选择错误时实时纠正；多视角融合算法则优化了空间感知能力。这些创新共同构成了完整的双臂协调解决方案。

当前研究仍存在局限性。所有测试均在仿真环境进行，未考虑真实世界中的机械误差、传感器噪声等因素；测试对象主要为刚性物体，对柔性材料操作的研究尚待深入；大型模型的推理速度也难以满足实时控制需求。这些挑战为后续研究指明了方向。

该成果对机器人产业发展具有重要推动作用。建立的标准化评估体系为厂商提供了客观比较基准，有助于引导技术路线向实用化方向发展。特别是测试中暴露的共性问题，为学术界和产业界协同攻关提供了明确目标。随着双臂协调能力的提升，服务机器人、工业协作机器人等领域有望迎来新的突破。

IT之家 2 月 25 日消息，在 The Linux Foundation Member Summit 期间，Agentic AIFoundation（AAIF）于 2 月 24 日宣布新增 18 家金牌…

IT之家 2 月 25 日消息，据日本《每日新闻》2 月 24日报道，通过让机器学习原始佛教经典中的文字，日本京都大学“人与社会未来研究院”的团队开发了可以进行佛教对话的生成 AI（人工智能）“佛机器人 P…

循着这一指引，郑州移动以5G、算力、人工智能等新一代信息技术为犁，在智慧社区、数字家庭、乡村振兴的广阔天地间深耕细作，让科技以多元路径融入民生，为提升群众获得感、幸福感、安全感注入强劲数字动能。不仅是为居…

在一帧帧精彩画面的背后，中国电信宜宾分公司按照最高标准、最严要求，组建专项保障领导小组，制定精细化方案与应急预案，提前部署、全程护航，依托5G-A、人工智能等创新技术赋能，为春晚节目圆满呈现提供了坚实可靠的通…

ISC2首席执行官斯科特·比尔说："网络安全专业人员不仅有保护和确保全球个人、组织和系统安全的重大责任，还有维护这个行业所依赖的诚信、问责制和信任的责任。它旨在规范专业义务和责任，重申道德行为重要性，并在合…

Ayyar说："这些推理节点现在将变得极其重要，需要准确理解这些推理点的确切约束是什么。它通过在Kubernetes编排和底层硬件之间引入策略抽象层，能够根据延迟、功耗、数据主权等实时约束条件，智能地将推理…

芯原股份的GCNano3DVG IP广泛应用于智能手表、AR/VR眼镜等轻量化空间计算设备，瑞芯微的芯片方案适配Openclaw技术，实现2.5D图形渲染与多模态交互等功能，推动消费电子从“响应指令”向“主动…

在视频一开头，UnitreeAs2从车上一跃而下，跟随一位男士开始跑步，显示出这款产品类似于消费级四足机器人的轻量化体格，字幕“徒步伙伴”也展现出其可以用于运动陪伴场景。在视频中，宇树还提及Unitre…

” 需要指出的是，此次Humain数据中心部署的是高通的AI100芯片，这是高通于2019年发布的一款数据中心AI芯片。2025月13日，Humain宣布与高通公司签署了一份谅解备忘录（MOU），旨在达…

据彭博社报道，触屏版 MacBook Pro 已经在路上了。到了 2025 年，Mark Gurman 又透露了一回，苹果会在 2026年底或者 2027 年初推出这个触屏版的 MacBook Pro。…

【环球网科技综合报道】2月25日消息，据宇树科技官方发布全新四足机器人UnitreeAs2，在动力、续航、环境适应性和交互能力上均实现显著升级。据介绍，As2自重仅18公斤，能够稳定承载15公斤负载，空…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.