ITBear旗下自媒体矩阵:

波士顿动力Atlas人形机器人:语言驱动策略模型,展现全新操作能力

   时间:2025-08-21 21:25:46 来源:AI寒武纪编辑:快讯团队 IP:北京 发表评论无障碍通道
 

波士顿动力再次震撼科技界,其最新发布的一段视频令人叹为观止。这家以研发先进人形机器人著称的公司,通过一项创新技术展示了Atlas机器人的卓越能力,让人们对未来机器人的应用充满了无限遐想。

视频中,Atlas机器人展现了一系列复杂且精细的操作,这些操作不仅考验了机器人的移动能力,更体现了其高度的灵活性和智能。波士顿动力成功地为Atlas训练了一个大型行为模型(LBMs),这是一种由语言指令驱动的策略模型,它能让机器人完成需要长远规划的复杂任务。

这一突破性成果的背后,是波士顿动力对通用人形机器人长期以来的不懈追求。他们相信,未来的通用人形机器人需要具备一系列复杂的技能,包括灵巧操作各种形态的物体、协调全身动作以调整姿态、改造环境、躲避障碍,以及在突发状况下保持平衡。为了实现这一目标,构建通用人工智能机器人成为了最为可行的路径。

在训练过程中,波士顿动力采用了四个关键步骤。首先,他们通过遥控操作在真实机器人和仿真环境中收集了大量的具身行为数据。接着,对这些数据进行处理、标注和筛选,以便轻松地融入机器学习流程。然后,使用所有任务收集到的数据,训练了一个统一的神经网络策略模型。最后,通过一套专门的测试任务来评估这个策略模型的表现,并根据评估结果指导后续的决策。

这个策略模型能够将图像、本体感觉和语言提示等输入信息转化为控制Atlas机器人活动的动作指令。研究人员采用了一种结合了流匹配损失的扩散型Transformer架构来训练模型,这使得Atlas能够以30Hz的频率进行活动。

在实践中,波士顿动力遵循了三大核心原则。他们致力于最大化任务覆盖范围,打造了一套顶尖的遥操作系统,能够完成从指尖级别的精细操作到全身参与的移动和抓取等各种任务。同时,他们训练通用策略模型,在一个庞大且多样化的任务数据集上进行训练,以提高模型的泛化能力和恢复能力。他们还构建了支持快速迭代和严谨科学研究的基础设施,通过将仿真、硬件测试和生产级别的机器学习基础设施相结合,持续提升机器人在真实世界中的表现。

视频中的“维修站”任务完美展示了Atlas机器人如何协调运动与操作。它需要机器人完成踏步、开阔步站姿、下蹲等协调的移动,以及抓取零件、二次抓握、操控、放置和滑动等一系列灵巧的操作。整个过程一镜到底,展示了由一个单一的、由语言驱动的策略模型来执行这完整的一系列任务。

更令人惊叹的是,这个策略模型具备智能应对意外情况的能力。例如,当零件掉到地上或箱盖突然合上时,机器人能够凭借训练中学到的经验做出相应的反应。这种强大的学习能力意味着,为Atlas编写新的操作行为不再需要高深的学位和多年的经验积累。

波士顿动力还研究了数十个任务,这些任务既是基准测试,也一次次地拓展了人们对机器人操作能力的认知边界。从简单的抓取-放置到更复杂的任务,如打绳结、翻转吧台凳、展开并铺平桌布,以及搬运重达22磅的汽车轮胎,Atlas机器人都展现出了出色的表现。对于易变形的物体如绳索、布料等,传统机器人编程技术处理起来极为困难,但对于大型行为模型来说,训练过程却是一样的:只要你能演示一遍,机器人就能学会。

策略模型还具备在模型推理时随时加快执行速度的能力,而无需重新训练。研究人员发现,将策略模型的执行速度提升1.5到2倍,都不会显著影响其性能。这表明,在某些情况下,机器人的执行速度甚至可以超越人类遥操作的速度极限。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version