ITBear旗下自媒体矩阵:

机器人新突破:π0.7模型问世,开启通用“大脑”组合泛化新纪元

   时间:2026-04-18 17:28:31 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

一家成立仅两年的机器人初创公司,凭借其最新发布的机器人基础模型π0.7,在科技领域引发了广泛关注。这款模型赋予机器人执行从未接受过明确训练任务的能力,无论是使用空气炸锅烹饪红薯,还是让从未接触过衣物折叠数据的工业机器人成功叠好T恤,都展现出其强大的泛化能力。

更令人惊讶的是,π0.7的这些能力并非刻意设计,而是在训练过程中自然“涌现”出来的。研究科学家Ashwin Balakrishna表示,当他深入了解数据内容时,通常能预估模型的能力,但这次却让他感到意外。他随机测试一个齿轮组,询问机器人能否转动,结果机器人真的做到了。这种超越死记硬背、能够组合技能解决新问题的能力,在机器人领域尚属首次,预示着机器人AI可能正接近类似大语言模型领域的“GPT-2时刻”,能力开始以超出基础数据预期的方式增长。

在空气炸锅使用实验中,π0.7的表现令人瞩目。当研究者要求它用空气炸锅烹饪红薯时,它虽未能完全成功,但完成了打开炸篮、尝试放入红薯等部分任务。要知道,模型从未见过完整的“拿起红薯-打开炸篮-放入-关闭-启动”操作链条。而当研究者采用语言指导方式,逐步给出指令时,π0.7能够精准跟随,成功完成任务。早期实验成功率仅5%,但在优化提示工程后,成功率跃升至95%。这一现象与大语言模型的“涌现”能力相似,π0.7能将从未一起出现过的技能重新组合。

跨具身迁移实验则展示了π0.7在物理形态层面的迁移能力。研究者在双臂UR5e系统上测试π0.7,该系统手臂更长、更重、惯性大,夹爪不够精确,且研究者从未用这个平台收集过衣物折叠数据,折叠T恤对它来说是“零样本”任务。然而,π0.7不仅成功折叠了T恤和毛巾,任务进度达到85.6%,成功率达到80%,与拥有375小时远程操作经验的顶级操作员在相同任务上的表现几乎持平。而且,π0.7在UR5e上采用的折叠策略与源机器人完全不同,它根据目标具身的物理特性调整了行为,这正是跨具身迁移的本质,即理解任务目标并找到适合当前身体的新解法。

在常规的灵巧操作任务上,π0.7同样表现出色。与通过强化学习微调的专用模型π0.6*相比,π0.7在制作浓缩咖啡、组装盒子、折叠衣物、削蔬菜皮、更换垃圾袋、切西葫芦、做花生酱三明治等任务上,都达到了与专用模型相当甚至更高的性能。在衣物折叠任务中,其吞吐量甚至超过了RL专家模型;在需要记忆的任务中,无需微调,开箱即用就达到与专用记忆模型相似的水平;在指令遵循方面,也大幅超越了前代模型π0.5和π0.6。它还能处理“分布外”的复杂指代指令,结合子目标图像时性能进一步提升,甚至能打破数据集的偏见,完成反向任务。

π0.7是一个参数量约50亿的视觉-语言-动作模型,其核心组件包括视觉-语言骨干网络、动作专家模块、记忆机制和多模态上下文。视觉-语言骨干网络基于Gemma3 4B模型,负责处理多视角图像、语言指令和机器人本体感知信息;动作专家模块是一个8.6亿参数的Transformer,采用流匹配目标生成连续动作;记忆机制沿用MEM架构,使模型能处理变长的历史帧;多模态上下文则让模型在训练时接受多种额外提示,并在推理时灵活组合使用。

π0.7的训练数据具有大规模异构的特点,包括多种机器人平台的演示数据、自主策略评估产生的数据、人类远程操作干预数据、第一人称人类视频以及互联网上的非机器人数据等。训练时,模型接受子任务语言指令、子目标图像、片段元数据和控制模式四种额外提示作为数据上下文,且每种提示会随机丢弃一部分。模型还通过元数据标注区分不同质量的数据,采用“知识绝缘”技术避免动作预测干扰预训练的视觉语言特征,从而稳定学习多模态上下文。

尽管π0.7取得了显著成果,但仍存在一些局限性。目前,它还无法仅凭一个高层次指令自主执行复杂的多步骤任务,对于长时程、多阶段的新任务,仍需人类通过语言指导或训练高层策略来分解子任务。机器人领域缺乏标准化的基准测试,使得外部验证变得困难,不同实验室之间的任务和环境差异大,难以直接比较。而且,物理世界的交互数据稀缺且昂贵,尽管π0.7使用了多种数据,但对于某些任务,零样本泛化的成功率仍低于分布内任务,未来需要更高效的数据利用方法。

不过,π0.7的发布标志着机器人基础模型从“死记硬背”走向“组合泛化”的初步突破。其多样化的上下文提示、元数据条件化和超大规模异构数据训练,使其在零样本下完成多项从未见过的任务,性能媲美人类专家和RL微调专用模型。这家初创公司已融资超10亿美元,最新估值达56亿美元,并正洽谈新一轮可能将其推至110亿美元的融资。虽然有人对其跨具身能力提出质疑,认为目前仅限于夹爪操作,尚未涉及更复杂的全身控制,但这并未掩盖多数人对该方向的乐观预期。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version