滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

灵初智能领跑具身智能赛道！10万小时人类数据助力，登顶MolmoSpaces全球榜单

时间：2026-04-12 15:47:24 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

灵初智能近期提出的解决方案引发关注。其研发的PSI框架包含策略模型Psi-R2与世界模型Psi-W0，通过整合近10万小时人类操作数据，构建了从人类技能到机器人执行的全链条训练体系。Psi-R2负责解析任务逻辑，学习“如何完成任务”；Psi-W0则通过预测不同动作的后果，补充“其他可能性会怎样”的推理能力。这一双模型架构突破了传统方法对数据对齐的依赖，转而采用“原始数据输入、原始数据输出”的直接映射策略，将人手关节运动通过运动学公式转换为机械臂可执行的指令，同时保留原始图像信息以减少人为干预误差。

人类数据与真机数据的融合是该方案的核心创新。灵初披露，其预训练数据集包含5417小时真机数据与95472小时人类数据，覆盖294种场景、4821类任务及1382种物体。相较于自动驾驶或语言模型领域可依赖的现成语料库，机器人训练数据需从现实操作中“逐帧采集”。人类数据的优势在于其天然包含任务目标、动作细节与时间节拍信息，例如手机装配中的微小部件操作，其动作精度与速度均经过长期实践优化，更贴近产业实际需求。实验表明，Psi-R2经预训练后，仅需不到100条真机轨迹微调，即可完成高精度任务如工业包装与纸盒折叠。

世界模型Psi-W0的引入解决了策略模型的局限性。传统方法仅能从成功轨迹中学习，而Psi-W0通过动作条件型视频预测机制，将动作作为生成条件，模拟不同动作下的场景变化。为增强模型对失败的认知，训练数据中特意混入约30%的失败样本，涵盖专项采集、常规操作与推理过程中的错误案例。这一设计使模型不仅能评估策略有效性，还可通过强化学习在虚拟环境中优化人类动作到机器人动作的转换。例如，在抓取任务中，Psi-W0可推演人类抓取动作在机器人动力学条件下的结果，若偏差过大则自动调整轨迹，直至符合执行标准。

数据质量而非数量成为训练效能的关键。灵初提出，高信噪比、精准3D位姿与任务多样性是衡量数据价值的核心指标。在感知模态优先级上，3D位姿精度远超2D图像与触觉信号，而触觉数据虽难在机器人端规模化部署，却可通过“掩码训练”方式间接利用——即屏蔽真机数据中的触觉通道，迫使模型预测接触信号，从而提升对交互过程的预判能力。人类操作节拍接近机械臂物理极限的特性，使其数据在训练中更具产业适配性。例如，遥操作节拍通常仅为机械臂上限的60%-70%，而人类在常规作业中的操作速度可逼近设备极限。

为推动行业生态发展，灵初同步开源了1000小时人类操作数据集。该数据集分为高精度与大规模扩展两类：前者经严格处理后轨迹与真机高度对齐，适用于精细任务训练；后者则通过可控精度扩大数据覆盖范围，强化模型泛化能力。这一结构设计与PSI框架形成闭环，既保障操作精度，又拓展预训练边界。在MolmoSpaces公开评测中，Psi-R2以显著优势登顶总榜，超越具身大模型标杆π与英伟达GEAR等主流方案，验证了其方法在真实世界任务中的有效性。

当前，具身智能训练框架的竞争已从单一模型性能转向系统化路径设计。灵初的方案通过整合人类数据、双模型架构与强化学习优化，构建了无需依赖大规模真机遥操作的数据驱动训练路径。这一路径不仅降低了数据采集成本，更通过模拟反事实推理与虚拟调优，缩短了模型从实验室到工厂的落地周期。随着1000小时开源数据集的释放，行业或将加速向“人类示范-虚拟优化-真机执行”的新训练范式转型。

更多>同类资讯

华为联合湖北移动AI推理加速现网测试，Token吞吐率大增372%

06-26

DeepSeek全网招人：从来不找天才让新人承担最核心任务

06-26

苹果涨价自身也有责任美光高管：压价采购加剧了内存荒

06-26

性能提升 475 倍！富士通推出PHOTON新架构，剑指AI算力瓶颈

06-26

AGI前夜的兵马跃进:DeepSeek全线部门扩容翻倍，大模型顶尖人才争夺战再升级

06-26

苹果涨价iPhone未涨官方回应：成本上涨不得不涨

06-26

Adobe宣布收购视频与图像AI模型开发商Topaz Labs，深化Firefly生态布局

06-26

华为携手湖北移动完成AI推理加速现网测试长序列场景下性能大幅提升

06-26

DeepSeek大规模招人：不唯天才论新人入职即挑AGI研发大梁

06-26

苹果多款产品因芯片成本上涨提价股价重挫市值一夜蒸发超1.7万亿元

06-26

苹果涨价背后：强硬压价采购策略或成内存短缺“推手”？

06-26

时隔九年中国超算再登顶！灵晟总设计师揭秘纯CPU架构选择缘由

06-26

DeepSeek大规模扩招！七大类三十余岗位虚位以待等你加入

06-26

工控芯片龙头中颖电子：股价低迷横盘两年，社保基金逆势布局有何考量？

06-26

Mobile AI浪潮下：中国电信5G-A x AI大上行网络开启通信新篇章

06-26

点击查看更多 +

全站最新

锦艺新材冲刺创业板IPO：借AI东风业绩攀升，扩产背后隐忧与机遇并存

深度内容消费升温 B站视频播客单日播放时长破亿赛道潜力凸显

AI赋能电商新飞跃：Accio Work携1688插件，开启内外贸“一句话经营”新纪元

新能源汽车补能网络升级：私人桩崛起，行业迈向精细化运营新阶段

华为申请车顶升降专利鸿蒙智行或推MPV新车型露营体验将迎新升级

阿维塔07L弦月银新色官图发布！内饰升级智驾加持 7月将亮相

热门内容

本栏最新

零跑D99震撼登场！25万级标配空悬四驱，终结MPV续航焦虑新标杆

亿纬锂能25周年庆启新程：创新驱动发展，携手伙伴共赴能源变革新未来

零跑D99上市！24.98万起售，双动力七座布局，科技豪华一步到位

PearlError-包含视频过滤

宇树科技R1人形机器人降价至2.99万元起行业价格下探或成趋势

亿纬锂能25周年庆启新程：创新驱动发展携手共赴智能零碳未来

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.