DeepMind推出Gemini Robotics On-Device：本地运行，让机器人更智能

时间：2025-07-20 14:24:17 来源：InfoQ编辑：快讯 IP：北京 发表评论无障碍通道

DeepMind，谷歌旗下的AI研究巨头，近期推出了一款名为Gemini Robotics On-Device的创新模型，该模型融合了视觉、语言和行动（VLA）功能，专为在机器人硬件上本地运行而设计。这一突破性的进展意味着机器人能够在无网络或需要低延迟响应的场景中，高效执行复杂指令。

作为Gemini Robotics家族系列的最新成员，Gemini Robotics On-Device首次实现了模型的微调功能，仅需50次演示即可针对特定任务进行优化。这一特性大大提升了模型的灵活性和实用性，使其能够迅速适应各种应用场景。DeepMind在双臂Aloha机器人上对该模型进行了初步训练，并在其他机器人平台上进行了测试，结果显示其在新硬件上的表现同样出色。

Gemini Robotics On-Device模型能够遵循自然语言指令，并通过视觉感知环境中的对象，进行智能推理和执行操作。DeepMind表示，这一本地解决方案将有效解决机器人领域面临的延迟和连接性挑战，推动机器人技术的进一步创新。他们还推出了Gemini Robotics SDK，为开发者提供了根据特定需求调整模型的工具，进一步加速了机器人应用的开发进程。

今年早些时候，DeepMind首次公开了Gemini Robotics家族系列。该系列基于谷歌的Gemini 2.0大型语言模型（LLMs），并增加了用于物理行动的输出模态。为了评估机器人技术的安全性和视觉推理能力，DeepMind还发布了ASIMOV基准测试和具身推理问答（ERQA）评估数据集。这些基准测试为机器人技术的研究和应用提供了重要的参考标准。

在实验中，DeepMind展示了Gemini Robotics模型快速适应新任务的能力。针对包括准备食物和玩牌在内的7种不同任务，他们对模型进行了最多100次的演示微调。结果显示，使用Gemini Robotics模型的机器人成功完成任务的比例超过60%，超过了当前最佳的本地VLA模型。Gemini Robotics模型的离线版本表现更为出色，成功率接近80%。

在Hacker News的讨论中，一位用户对Gemini Robotics On-Device模型的前景表示乐观。他认为，VLAs有望成为机器人技术的“ChatGPT时刻”，通过微调多模态LLMs，可以输出特定指令序列来控制机器人。这位用户还指出，虽然目前大多数关注点在机器人手臂的物体操纵上，但这种方法同样适用于其他任务，如智能割草机等。

目前，Gemini Robotics On-Device模型尚未广泛可用，但感兴趣的开发者可以通过注册等待名单获取访问权限。同时，Gemini Robotics-ER模型的互动演示已在网站上上线，供用户体验。Gemini Robotics SDK也已开源至GitHub平台，供开发者下载和使用。

DeepMind的这一创新不仅为机器人技术带来了革命性的突破，也为开发者提供了强大的工具，推动机器人应用在更多领域实现智能化和自动化。随着技术的不断进步和应用的不断拓展，我们有理由相信，未来的机器人将更加智能、灵活和高效。

考虑到生产系统对稳定性和保密性的极高要求，网络系统采用独立网络架构，与其他网络完全隔离，有效避免了外部网络的干扰和潜在风险，确保了各网络能够稳定、可靠地运行。公司在全厂范围内进行了工业环网的铺设，这一举措为…

现场固化烘箱主要通过西门子PLC、台达PLC等控制器进行控制，通过实现PLC数据采集到数之能数据中台，随后通过MQTT、Modbus等协议对接到MES系统中，为生产和设备管理提供全面可靠的数据支持，从而不断…

这种技术不仅为各种工业设备提供了网络接入的可能，而且在电能质量管理中发挥着不可忽视的作用。ModbusTCP转Ethernet/IP网关在电能质量管理中的应用是多方面的，它不仅提高了数据通信的效率和准确性，而…

陕西冠杰定制光电转台以“硬件加速+协议优化+智能调度”为核心，构建多维度低延迟传输技术体系，将端到端控制延迟压缩至毫秒级，即使在复杂网络环境下仍保持稳定的低延迟性能。边缘计算节点部署在转台本地，可对采集的图像…

11 月 25 日消息，亚马逊 Amazon Leo（IT之家注：即原 Project Kuiper）卫星网络服务当地时间 24日公布了其面向企业用户的旗舰终端设备 Leo Ultra。 Leo Ultra…

随着数字化转型的加速推进，苏州某科技企业近期通过将整体机房运维外包给苏州胜网服务商模式重构了IT基础设施管理体系，将服务器维保、网络运维等核心业务交由专业服务商托管，实现了运维成本降低37%和系统可用性提升至…

同时，南凌科技覆盖全球的骨干网络及深圳、上海双运营中心（NOC&SOC），为服务的稳定交付与闭环管理提供了强大资源和运维保障。南凌科技通过创新的SD-WAN技术架构，为知名光伏企业构建覆盖全球的智能网络解决…

现在他的业务简直开了挂，专门帮那些在行业里摸爬滚打二三十年的CEO，在TikTok时代打造个人品牌，客户量级从刚起步的小公司，一路冲到估值十亿美元的大企业，不少客户还主动找上门，想定制专属AI智能体。其实…

全民拼购创新融合社交裂变与拼团模式，突破传统低价竞争思维，将"价值共享"融入规则设计——通过合理让渡产品利润，构建无风险参与机制。三、繁荣背后的挑战：低价策略的潜在风险全民拼购虽凭借低价策略快速聚集流量，却…

胖东来客流如织的秘诀，正在于其“真诚为本”的价值观，通过高品质高性价比的商品、以人为本的细节服务、员工与顾客双向幸福的经营逻辑，最终赢得了广泛的客户认同与深度信任。此次银川阅彩城店并非简单复制胖东来模式，而…

11 月 25 日消息，亚马逊 Amazon Leo（IT之家注：即原 Project Kuiper）卫星网络服务当地时间 24日公布了其面向企业用户的旗舰终端设备 Leo Ultra。 Leo Ultra…

在适应复杂环境方面，LeoUltra进行了针对性设计，产品具备坚固耐候特性，能够抵御高低温、降水及强风等多种自然条件考验，可满足不同场景下的企业使用需求。此次启动的Amazon Leo服务企业预览阶段，…

AI云平台领域的重要企业涂鸦智能（纽交所代码：TUYA；港交所代码：2391）公布了其2025年第三季度财务业绩。数据显示，该季度公司营收达8249万美元，较上年同期增长约1.1%，经营利润为380万美元，净利润为1500万美元，经调整后净利润为2010万美元。公司经营活动产生的现

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.