波士顿动力公司近期的一项技术革新引发了广泛关注,其明星产品Atlas机器人迎来了端到端人工智能(AI)技术的全面升级。这次更新不仅让Atlas能够听懂自然语言指令,更赋予了它自主规划动作和灵活应对意外情况的能力。
在演示视频中,测试人员故意给Atlas设置了重重障碍。例如,当测试人员合上箱子盖子时,Atlas凭借先进的视觉识别技术,能够迅速识别并准确打开箱子。即便测试人员移动箱子的位置,Atlas也能即时感知到这一变化,并调整自己的行动策略。面对散落在附近的装置,Atlas同样能够敏锐地发现,并将其准确无误地放入箱子内。
据官方介绍,这次的技术升级是波士顿动力与丰田研究院联手合作的成果,基于大型行为模型(LBM)推出了Atlas的新版本——Atlas MTS。这一成果在YouTube上发布后,迅速吸引了超过十万次的观看和上万次的点赞,引发了网友们的热烈讨论。
网友们对Atlas的新能力表示了高度认可,特别是其膝盖能够弯曲的设计,被认为能够大大减少背部受伤的风险。不少网友在评论区留言表示,这一改进非常贴心,对机器人的“身体健康”表示关心。
在详细的技术报告中,波士顿动力揭示了Atlas实现全新能力的关键步骤。他们采用了端到端的语言条件策略,使机器人能够充分发挥自身优势,实现行走、精确放置双脚、蹲下、转移重心等一系列复杂动作,同时避免自身碰撞。这一策略的构建过程包括收集具身行为数据、处理标注数据、训练神经网络以及利用测试任务评估策略效果。
这次升级采用的大型行为模型是基于4.5亿参数的扩散Transformer模型,并结合流匹配目标,能够将包括30Hz图像、人体感觉和自然语言指令在内的多种输入信息转化为控制Atlas活动的动作指令。Transformer模型如同“全局之眼”,把控整体架构和动作细节的关联,而扩散过程则负责将模糊指令细化为精准动作,流匹配损失则确保动作既符合现实情况又能灵活适应不同场景。
波士顿动力还将Atlas的模型预测控制器与VR界面相结合,使得远程操作员能够充分发挥机器人的性能,将自身动作和感知与机器人的状态保持同步。这一创新设计覆盖了从手指级精细操作到全身伸展、移动等各类任务需求,大大提升了Atlas的实用性和灵活性。
最令人瞩目的升级在于,Atlas现在能够自主处理意外情况。当遇到零件掉在地上或箱盖未关闭等问题时,Atlas能够智能地做出反应,调整自己的行动策略。这一能力不仅展示了Atlas的智能化水平,也为其在复杂环境中的应用提供了更多可能性。
波士顿动力还表示,只要是人能演示的动作,Atlas都可以学习并模仿。例如,系绳子、折叠椅子和翻轮胎等复杂动作,Atlas都能够通过学习和训练掌握。这一学习能力让Atlas在工业机器人领域具有广阔的应用前景。
波士顿动力在近年来逐渐从液压驱动转向电驱动。与液压系统相比,电机驱动具有更高的精确度和更低的能耗,且天然适配AI学习框架。这一转变不仅提升了Atlas的性能,也为其拥抱全新的技术方向奠定了基础。