ITBear旗下自媒体矩阵:

谷歌发布Gemini机器人AI本地运行模型,引领新一代机器人技术

   时间:2025-06-26 00:31:25 来源:ITheat热点科技编辑:快讯团队 IP:北京 发表评论无障碍通道

谷歌在机器人技术领域再次迈出重要一步,近日宣布推出Gemini Robotics On-Device模型,这是其“视觉语言动作”(VLA)模型的升级版。这一新版本经过特别优化,旨在直接在机器人设备上运行,无需依赖云端或数据中心。

据谷歌介绍,Gemini Robotics On-Device代表了他们目前最先进的VLA技术。这一模型能够独立于数据网络运作,这对于需要即时响应的应用场景尤为重要。在网络不稳定或完全无网络的环境中,该模型仍能保持稳定运行,从而大大扩展了机器人的应用场景。

谷歌DeepMind的高级总监兼机器人项目主管表示,Gemini Robotics On-Device专为双臂机器人设计,旨在提升其处理复杂任务的灵活性和适应性。在之前的演示中,搭载了这一本地模型的机器人已经能够轻松完成如拉开拉链和折叠衣物等精细动作。

谷歌进一步透露,虽然Gemini Robotics On-Device最初是为ALOHA机器人训练的,但经过调整后,它现在也能适用于双臂Franka FR3机器人和Apollo人形机器人。这一兼容性使得该模型具有更广泛的应用潜力。

为了支持开发人员的创新,谷歌DeepMind还发布了Gemini Robotics SDK。借助这一工具包,开发人员可以在MuJoCo高级物理模拟器上利用这些模型,通过向机器人展示50到100个任务演示来训练它们完成任务。这大大降低了机器人编程的门槛,使得更多人能够参与到机器人技术的开发中。

与单纯的“大语言模型”相比,机器人AI面临着更多的挑战。因为它们不仅存在于物理世界中,还会改变其环境。谷歌DeepMind机器人技术负责人强调,Gemini不仅能够生成文本、写诗、总结文章甚至编写代码,现在还能生成机器人动作。这意味着谷歌的机器人模型已经能够通过大数据训练来掌握各种动作,在快速迭代中应对物理世界的各种挑战。

在安全性方面,谷歌也采取了严格措施。他们采用多层限制的方法来控制机器人,确保指令的安全执行。具体来说,一个底层VLA模型负责控制机器人的基本操作,而一个上级VLA模型则通过推理来判断哪些指令是安全的。这种“AI管理AI”的方式大大增强了机器人的安全性。

随着谷歌在机器人技术领域的不断突破,越来越多的公司也开始关注这一领域。包括Nvidia在内的许多企业都在秘密研发自己的机器人项目。在国内,同样有许多企业在默默耕耘,期待在新一轮的AI大战中崭露头角。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version