滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

机器人新突破：π0.7模型问世，开启通用“大脑”组合泛化新纪元

时间：2026-04-18 17:28:31 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

一家成立仅两年的机器人初创公司，凭借其最新发布的机器人基础模型π0.7，在科技领域引发了广泛关注。这款模型赋予机器人执行从未接受过明确训练任务的能力，无论是使用空气炸锅烹饪红薯，还是让从未接触过衣物折叠数据的工业机器人成功叠好T恤，都展现出其强大的泛化能力。

更令人惊讶的是，π0.7的这些能力并非刻意设计，而是在训练过程中自然“涌现”出来的。研究科学家Ashwin Balakrishna表示，当他深入了解数据内容时，通常能预估模型的能力，但这次却让他感到意外。他随机测试一个齿轮组，询问机器人能否转动，结果机器人真的做到了。这种超越死记硬背、能够组合技能解决新问题的能力，在机器人领域尚属首次，预示着机器人AI可能正接近类似大语言模型领域的“GPT-2时刻”，能力开始以超出基础数据预期的方式增长。

在空气炸锅使用实验中，π0.7的表现令人瞩目。当研究者要求它用空气炸锅烹饪红薯时，它虽未能完全成功，但完成了打开炸篮、尝试放入红薯等部分任务。要知道，模型从未见过完整的“拿起红薯-打开炸篮-放入-关闭-启动”操作链条。而当研究者采用语言指导方式，逐步给出指令时，π0.7能够精准跟随，成功完成任务。早期实验成功率仅5%，但在优化提示工程后，成功率跃升至95%。这一现象与大语言模型的“涌现”能力相似，π0.7能将从未一起出现过的技能重新组合。

跨具身迁移实验则展示了π0.7在物理形态层面的迁移能力。研究者在双臂UR5e系统上测试π0.7，该系统手臂更长、更重、惯性大，夹爪不够精确，且研究者从未用这个平台收集过衣物折叠数据，折叠T恤对它来说是“零样本”任务。然而，π0.7不仅成功折叠了T恤和毛巾，任务进度达到85.6%，成功率达到80%，与拥有375小时远程操作经验的顶级操作员在相同任务上的表现几乎持平。而且，π0.7在UR5e上采用的折叠策略与源机器人完全不同，它根据目标具身的物理特性调整了行为，这正是跨具身迁移的本质，即理解任务目标并找到适合当前身体的新解法。

在常规的灵巧操作任务上，π0.7同样表现出色。与通过强化学习微调的专用模型π0.6*相比，π0.7在制作浓缩咖啡、组装盒子、折叠衣物、削蔬菜皮、更换垃圾袋、切西葫芦、做花生酱三明治等任务上，都达到了与专用模型相当甚至更高的性能。在衣物折叠任务中，其吞吐量甚至超过了RL专家模型；在需要记忆的任务中，无需微调，开箱即用就达到与专用记忆模型相似的水平；在指令遵循方面，也大幅超越了前代模型π0.5和π0.6。它还能处理“分布外”的复杂指代指令，结合子目标图像时性能进一步提升，甚至能打破数据集的偏见，完成反向任务。

π0.7是一个参数量约50亿的视觉-语言-动作模型，其核心组件包括视觉-语言骨干网络、动作专家模块、记忆机制和多模态上下文。视觉-语言骨干网络基于Gemma3 4B模型，负责处理多视角图像、语言指令和机器人本体感知信息；动作专家模块是一个8.6亿参数的Transformer，采用流匹配目标生成连续动作；记忆机制沿用MEM架构，使模型能处理变长的历史帧；多模态上下文则让模型在训练时接受多种额外提示，并在推理时灵活组合使用。

π0.7的训练数据具有大规模异构的特点，包括多种机器人平台的演示数据、自主策略评估产生的数据、人类远程操作干预数据、第一人称人类视频以及互联网上的非机器人数据等。训练时，模型接受子任务语言指令、子目标图像、片段元数据和控制模式四种额外提示作为数据上下文，且每种提示会随机丢弃一部分。模型还通过元数据标注区分不同质量的数据，采用“知识绝缘”技术避免动作预测干扰预训练的视觉语言特征，从而稳定学习多模态上下文。

尽管π0.7取得了显著成果，但仍存在一些局限性。目前，它还无法仅凭一个高层次指令自主执行复杂的多步骤任务，对于长时程、多阶段的新任务，仍需人类通过语言指导或训练高层策略来分解子任务。机器人领域缺乏标准化的基准测试，使得外部验证变得困难，不同实验室之间的任务和环境差异大，难以直接比较。而且，物理世界的交互数据稀缺且昂贵，尽管π0.7使用了多种数据，但对于某些任务，零样本泛化的成功率仍低于分布内任务，未来需要更高效的数据利用方法。

不过，π0.7的发布标志着机器人基础模型从“死记硬背”走向“组合泛化”的初步突破。其多样化的上下文提示、元数据条件化和超大规模异构数据训练，使其在零样本下完成多项从未见过的任务，性能媲美人类专家和RL微调专用模型。这家初创公司已融资超10亿美元，最新估值达56亿美元，并正洽谈新一轮可能将其推至110亿美元的融资。虽然有人对其跨具身能力提出质疑，认为目前仅限于夹爪操作，尚未涉及更复杂的全身控制，但这并未掩盖多数人对该方向的乐观预期。

更多>同类资讯

ChatGPT“锁定模式”全面开放个人用户可启用降低数据泄露风险

IT之家 6 月 6 日消息，OpenAI 昨天宣布为所有 ChatGPT 个人用户开放“锁定模式”，启动后可限制多项需要互联网 /外部服务的功能，降低数据泄露风险。同时，锁定模式启用后还将禁用文件下载、…

06-06

全球机器人盛会ICRA 2026：狮子山实验室破叠衣难题，斩获冠军！

正是在这一系统能力支撑下，面对真实机器人环境中的硬件误差、夹爪稳定性、动作偏移、长尾状态恢复和现场不确定性等挑战，实验室参赛团队将仿真阶段积累的策略能力成功迁移到真实场景，并在LeHome Challeng…

06-06

“十五五”规划下AI差异化布局渐显全国协同发展格局初定

朱明皓建议，发展人工智能产业要加强统筹，在空间布局上明确各地的差异化战略定位，形成场景、算力与技术的全国协同：第一梯队依托京津冀、长三角、粤港澳大湾区，攻坚具身智能等前沿技术，打造国家级应用中试基地，抢占全…

06-06

ChatGPT“锁定模式”全面开放个人用户可启用降低数据泄露风险

IT之家 6 月 6 日消息，OpenAI 昨天宣布为所有 ChatGPT 个人用户开放“锁定模式”，启动后可限制多项需要互联网 /外部服务的功能，降低数据泄露风险。同时，锁定模式启用后还将禁用文件下载、…

06-06

擎天全税通冲刺港股上市：工银国际保驾，跨境财税数字化赛道前景可期

06-06

交大博士团队创业拓璞数控，凭硬核技术成“商业航天第一股”

这一年，拓璞数控成功研制并签约出售了中国首台用于火箭燃料箱加工的搅拌摩擦焊五轴机床，用实打实的硬科技产品叩开了市场的大门，填补了国内重载五轴双摆头技术的空白。从紧凑型通用五轴机床（跨度＜3m）到大尺寸碳纤…

06-06

网传比亚迪人形机器人代号“尧舜禹”且年内自用2万台比亚迪辟谣不实

06-06

吉利中国星i-HEV智擎混动武汉节油赛：真实路况验证超低油耗实力

06-06

比亚迪：“人形机器人代号尧舜禹”等消息均不属实

6 月 6 日消息，据《每日经济新闻》报道，日前，比亚迪自研人形机器人的消息引发广泛关注。网传其自研人形机器人代号“尧舜禹”，计划于 2026 年在内部部署 2 万台。对此，该记者向比亚迪方面求证，对方表示：“‘比亚迪人形机器人代号尧舜禹’‘第七代原型机在深圳和长

06-06

黄仁勋谈未来计算：收敛为面向AI智能体的统一架构

06-06

苹果iPadOS 27系统前瞻：Safari智能分组、Spotlight整合Siri、快捷指令更便捷

06-06

孙正义称超级智能两年内将至递归式自我改进引AI界热议

06-06

古尔曼爆料：iOS 27升级Find My体验，照片应用或实现自然语言编辑

06-06

ChatGPT记忆系统升级：像“另一个你”的AI助手，正悄然改变人机关系

06-06

比亚迪辟谣人形机器人代号“尧舜禹”传言，透露机器人开发规划与愿景

06-06

点击查看更多 +

全站最新

字节跳动明确辟谣：未涉足造车领域赛豆与字节无股权关联

从“机翻乌龙”到全网热议：阿迪达斯如何用“城里办事”玩转品牌营销？

字节跳动澄清：赛豆非旗下汽车品牌，无造车计划专注技术服务

字节跳动明确回应：无造车计划，赛豆非旗下汽车品牌

字节跳动再发声：明确否认造车计划与赛豆无股权合作

字节跳动明确表态不造车：“赛豆”与字节跳动无股权合作关联

热门内容

本栏最新

吉利中国星i-HEV智擎混动武汉节油赛：真实路况验证超低油耗实力

AI时代已至：抓住这次技术红利，普通人也能实现财富跃迁与能力升级

卓驭科技与高通再携手新一代舱驾融合方案助力汽车中央计算升级

华为数据存储赋能医疗智能化：四大方案助力，3900余家机构升级转型

6月多款SUV即将登场：理想、比亚迪、五菱等品牌新车齐聚

数字化领航碰撞安全新征程：第四届博士生论坛分会场共话创新未来

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.