在具身智能领域,一个名为MotuBrain的模型近期成为焦点。此前,该模型在物理世界理解与动作执行的两大国际基准测试中悄然登顶,引发业内广泛关注与猜测。近日,凭借视频大模型Vidu在行业内崭露头角的生数科技正式宣布,MotuBrain正是其在具身智能领域的最新商业化成果,这一消息为行业带来了新的活力。
MotuBrain此次在测试中的表现堪称惊艳。在WorldArena(考察物理世界理解)和RoboTwin2.0(考察动作执行)这两项权威测试中,它均刷新了历史记录。特别是在模拟随机扰动的复杂环境下,MotuBrain展现出强大的实力,成为唯一平均分突破95分的模型,其出色的泛化能力令人瞩目。
MotuBrain采用了创新的“世界动作模型”(World Action Model)路径,与传统“先想象再执行”的模式截然不同。这种“边看边动”的设计理念,让机器人在决策的同时进行推演,有效避免了预测与执行偏差的相互放大,从而极大地提升了响应速度。在实际演示中,搭载MotuBrain系统的机器人展现出了极高的智能化水平。以火锅局场景为例,机器人能够通过视觉准确判断勺子是否为空,并自主决定是否重新捞取,而非机械地重复预设动作,这种“察言观色”的能力标志着机器人正从简单的机械执行迈向真正的智能决策。
MotuBrain的核心优势在于其强大的通用性。它支持“一脑多型”,能够适配不同自由度和传感器的机器人本体,这意味着同一套“大脑”可以应用于多种类型的机器人。它还具备“一脑贯通”的长程任务处理能力。在插花、调酒、整理沙发等演示中,机器人能够连续完成超过10个原子动作,整个过程流畅自然,无需人工干预。数据显示,随着任务种类的增加,MotuBrain的学习成功率呈上升趋势,这表明该模型掌握的是物理世界的通用底层规律,而非简单地死记硬背动作模版,任务越多样,其表现越出色。
生数科技此次展示的实力并非偶然,而是源于其深厚的技术积淀。该公司通过全球首创的U-ViT架构,实现了数字世界生成(VGM)与物理世界执行(WAM)的统一。左手Vidu生成虚拟世界,右手MotuBrain驱动实体交互,这种双轨布局使生数科技在数据获取成本与模型迭代速度上具备显著优势,为其在具身智能领域的发展奠定了坚实基础。
目前,生数科技已与无界动力、星尘智能等多家企业达成战略合作。随着具身智能竞争重心的转移,拥有通用化“大脑”的模型开发者正逐渐成为重塑行业格局的关键力量,MotuBrain的出现无疑为这一趋势增添了新的变量。











