ITBear旗下自媒体矩阵:

灵初智能发布10万小时人类数据方案,Psi-R2系统协同登顶全球基准评测

   时间:2026-04-13 03:22:36 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

具身智能领域正迎来一场关键变革,行业焦点逐渐从依赖真机遥操作数据转向挖掘人类操作数据的深层价值。传统模式下,真机数据采集成本高昂、效率低下,且难以真实反映复杂场景中的操作节拍与稳定性要求。当实验室演示与工业现场实际需求产生鸿沟时,如何将人类积累的操作经验转化为机器人可规模化学习的能力,成为决定下一阶段竞争格局的核心命题。

某智能科技公司近期发布的创新成果,为这一难题提供了系统性解决方案。其推出的策略模型Psi-R2与世界模型Psi-W0,配合近10万小时的人类操作数据集,构建起"数据-模型-强化学习"三位一体的技术框架。其中首批开源的1000小时人类手部操作数据,凭借多场景、多任务、多物体的覆盖特性,成为当前全球规模最大的同类数据集之一。这套体系包含5417小时真机数据与95472小时人类数据,通过分层数据结构实现精度与泛化能力的平衡——高精度数据确保操作上限,大规模数据提供场景适应性。

技术实现层面,研发团队突破传统数据对齐的思维定式。面对人手与机械手在运动学、动力学上的本质差异,团队放弃复杂的数据修饰方法,转而采用"原始数据输入输出"的简洁策略。通过运动学映射实现关节维度对齐,保留图像原始信息直接输入模型,这种设计使Psi-R2具备同时预测未来视频帧与机器人动作序列的能力。基于预训练视频生成模型架构,该策略模型仅需不足百条真机轨迹微调,即可完成手机装配、工业包装等复杂任务。

世界模型Psi-W0的引入,则构建起虚拟试错空间。该模型在预测未来视频的基础上,特别强化对失败场景的建模能力,其训练数据中包含约30%的失败案例。通过接收图像、语言及动作轨迹信息,Psi-W0能够评估策略模型的输出轨迹,在机器人动力学约束下进行精细化修正。这种"人类策略输入-世界模型评估-强化学习优化"的闭环机制,形成持续进化的数据飞轮:优质轨迹回流训练集,失败案例提升模型鲁棒性。

工程优化为技术落地扫清障碍。通过模型压缩、编译优化与量化技术,系统推理时延从2.2秒压缩至100毫秒以内,满足连续精细操作的实时性要求。成本维度上,人类数据采集成本较传统真机方案降低超90%,且采集节拍更贴近真实作业场景。在艾伦人工智能研究所发起的MolmoSpaces权威评测中,Psi-R2在不使用特定机器人数据的情况下,以46.4%的成功率登顶Combined榜单,在任务覆盖率与综合性能上超越NVIDIA、PI等国际顶尖团队。

行业观察指出,这套解决方案的价值不仅在于技术突破,更在于重新定义了具身智能的发展路径。当数据分布的重要性排序被确立为"任务多样性>物体多样性>>场景多样性",当触觉信号被视为跨具身交互的通用语言,整个领域的研究范式正在发生根本性转变。随着首批开源数据的释放,全球研究者将获得验证新范式的公共基准,这或许标志着具身智能从实验室演示向工业级部署的关键转折。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version