具身智能领域迎来重要合作,智象未来(HiDream.ai)与诺亦腾机器人(Noitom Robotics)正式签署战略合作协议。双方将整合多模态大模型视频生成技术与动作捕捉基础设施,共同探索具身智能训练数据的大规模生成路径。此次合作聚焦于突破行业数据瓶颈,通过融合真实世界采集与生成式技术,为产业提供高质量、结构化的数据解决方案。
当前,具身智能发展面临的核心挑战之一是高质量多模态训练数据的稀缺。传统数据采集方式存在成本高、效率低等问题,难以满足产业对大规模、可扩展数据的需求。针对这一痛点,两家企业提出“真实数据+生成式视频数据”的创新模式,计划在年内合作生成数万小时具身智能视频数据,覆盖复杂场景下的多样化动作需求。
诺亦腾机器人在合作中承担底层数据支撑角色。据其联合创始人兼首席科学家韩磊博士介绍,单一数据源无法支撑模型在复杂物理环境中的泛化能力。此次合作通过整合高精度动作捕捉设备采集的真实人类动作数据,与生成式视频技术结合,旨在突破现有数据规模与质量的双重限制。该公司提供的动作捕捉系统可实现毫米级精度,为数据真实性提供保障。
智象未来则贡献其核心技术——毫米级高可控视频生成能力。联合创始人兼CTO姚霆博士表示,通用视频生成模型常出现物理逻辑不一致问题,而智象未来基于自研多模态大模型,对原始动捕数据进行百倍级精细化处理。该技术不仅使生成数据在场景、光影、人体形态上达到高复杂度,更确保每帧视频与底层操作数据的精准匹配,有效解决数据可用性问题。
合作双方的技术互补性为具身智能发展开辟新路径。诺亦腾的真实动作数据提供物理世界的基础框架,智象未来的生成技术则扩展了数据的多样性与规模。这种融合模式既保证了数据的真实性,又通过生成技术突破了现实采集的局限性,为训练更强大的具身智能模型奠定基础。
根据规划,两家企业将围绕数据闭环构建展开长期合作。除现有数据生成项目外,未来还将探索虚拟生成与物理验证的链路打通,推动VLA模型规模化演进与世界模型协同驱动。通过构建完整的具身智能数据生态,合作有望加速行业从技术验证向商业化落地的进程。











