ITBear旗下自媒体矩阵:

智元机器人发布通用基座大模型GO-1,新人形机器人即将亮相!

   时间:2025-03-11 17:32:31 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在机器人技术的前沿探索中,一款名为智元启元大模型Genie Operator-1(简称GO-1)的通用具身基座模型横空出世,由智元机器人公司于近日正式发布。这款模型采用了创新的Vision-Language-Latent-Action(ViLLA)框架,该框架融合了VLM(多模态大模型)与MoE(混合专家)技术,展现了多项突破性优势。

GO-1的核心竞争力在于其小样本快速泛化能力,这意味着它能够在极少的数据支持下迅速适应新场景和新任务。这一特性得益于ViLLA框架中的VLM组件,它基于互联网大规模纯文本和图文数据进行训练,赋予了GO-1强大的场景感知和理解能力。而MoE组件则通过隐动作专家模型和动作专家模型,进一步提升了模型的动作理解和精细执行能力。

在智元机器人的设计中,GO-1不仅仅是一个孤立的模型,而是一个能够持续进化的系统。通过智元提供的数据回流系统,GO-1能够从实际执行中遇到的问题数据中不断学习和改进,从而不断提升其性能。GO-1还具备“一脑多形”的跨本体应用能力,这意味着它可以在不同的机器人形态之间自由迁移,快速适配各种本体。

GO-1的构建基于一个称为具身领域的数字金字塔的架构。这个金字塔的底层由互联网的大规模纯文本与图文数据组成,为机器人提供了基础的知识和场景理解能力。往上一层,是人类操作和跨本体视频数据,这些数据帮助机器人学习各种动作操作模式。再往上,则是用于增强泛化性的仿真数据,以及用于训练精准动作执行的高质量真机示教数据。

在实际应用中,GO-1展现了其卓越的性能。用户只需通过简单的语言指令,如“挂衣服”,GO-1就能根据视觉信号和语言指令,直接输出并执行相应的动作。这一过程涉及多个步骤,包括理解指令含义、识别相关物体和环境、模拟任务过程以及精准执行动作。

GO-1的应用场景广泛,从家庭生活的日常任务到商务会议的辅助工作,都能轻松胜任。在家庭中,它可以帮忙倒水、烤吐司;在商务场合,它能快速响应指令,如拿取饮料和水果。GO-1还能通过数据回流持续进化,不断提升其执行任务的准确性和效率。

智元机器人还预告了未来的发展规划,包括推出基于强化学习的仿真模型以及新的人形机器人。这些新进展将进一步推动具身智能的发展,加速其向通用化、开放化与智能化的迈进。GO-1的出现,标志着机器人技术已经迈出了重要的一步,为未来的机器人应用开辟了广阔的前景。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version