谷歌发布最强VLA模型：为机器人打造离线智能与定制化“操作系统”

时间：2025-06-26 17:26:10 来源：财联社编辑：快讯团队 IP：北京 发表评论无障碍通道

谷歌近期宣布了一项创新技术突破，推出了一款名为Gemini Robotics On-Device的视觉-语言-动作（VLA）模型，专为双臂机器人设计。这款模型被标榜为谷歌迄今为止最强大的机器人基础模型，其核心优势在于对计算资源的极致优化。

Gemini Robotics On-Device不仅具备卓越的通用灵巧操作能力，还能实现任务泛化，这意味着它能够迅速适应并执行各种新任务。通过微调，该模型能够针对特定应用场景提升性能，从而支持快速实验和高效任务执行。

尤为引人注目的是，Gemini Robotics On-Device能够完全在机器人设备上离线运行。这一特性使其特别适用于对延迟敏感的应用场景，即便在网络连接不稳定或完全中断的情况下，也能保持稳定运行。谷歌强调，这一创新使得机器人在断网环境下依然能够“观察、理解并执行指令”。

在多个测试场景中，Gemini Robotics On-Device展现了强大的视觉识别、语义理解和行为执行能力。它能够理解自然语言指令，并成功完成如拉开拉链、折叠衣物等高难度灵巧任务。这些能力不仅展示了模型的泛化性能，也预示着其在实际应用中的巨大潜力。

除了离线运行外，Gemini Robotics On-Device的另一大亮点是其高度的可微调性。这一特性不禁让人联想到安卓系统的开放性，安卓系统通过高度开放的架构，让开发者和厂商能够定制系统以满足用户需求。而Gemini Robotics On-Device则是通过可微调性，让机器人能够更好地适应和执行各种任务。

作为谷歌首个对外开放的VLA模型，Gemini Robotics On-Device允许开发者进行适配，以提升在具体应用场景中的性能。据谷歌介绍，仅需50-100个示范样本，该模型就能显示出良好的泛化能力。这一特性使得Gemini Robotics On-Device在实际应用中具有极高的灵活性和适应性。

为了验证模型的性能，谷歌在七个不同难度级别的灵巧操作任务中进行了测试，包括拉上便当盒拉链、抽卡和倒沙拉酱等操作。测试结果显示，Gemini Robotics On-Device在各种任务中都表现出了出色的性能。

谷歌还将Gemini Robotics On-Device模型适配到了Franka FR3双臂机器人和Apollo人形机器人等不同的机器人实体上。在双臂Franka机器人上，该模型能够执行通用指令，包括处理未见过的物体和场景、完成灵巧任务以及执行高精确度的工业传送带组装任务。而在Apollo人形机器人上，谷歌对模型进行了适应性调整，以适配其独特的实体形态。

这些成功的应用案例不仅展示了Gemini Robotics On-Device模型的强大功能，也预示着其在未来机器人技术领域的广阔应用前景。

值得一提的是，中央汇金已买入该公司1628万股，这无疑是对其发展前景的极大认可。蚣肿豪，将本求财主页发送“999”可知，其以成套自主知识产权技术实力获得了行业的高度认可，并在工业与建筑机器人领域占据了重要地…

我们在 ScienceBoard 评测基准上评估了当前代表性的（1）商业模型（2）开源模型（3）GUI 基座模型所构建的智能体的表现，结果揭示：即便是当今最强的多模态大模型，在真实科研工作流中也远未成熟。实…

据了解，银河通用成立于2023年5月，专注于研发人形机器人硬件和具身智能大模型。今年3月，“银河通用”全球首个人形机器人智慧零售解决方案官宣落地，由具身大模型机器人Galbot全天候在50平方米的无人店铺内…

据了解，日本科研团队在“女性仿生机器人”研发上持续发力，被称作“机器人之父”的石黑浩曾表示，这类美女仿生机器人的年龄设定可灵活调整，不仅容貌出众，性情也十分温顺，能将家居环境整理得井然有序。值得注意的是，其…

电力行业作为国家基础设施建设的核心领域，设备巡检工作面临诸多现实挑战：输电线路分布广、地形复杂，传统人工巡检效率低下；变电站设备数量庞大，人工检测难以全面覆盖；野外作业风险高，人员安全难以保障。边缘层：机…

工作人员通过耕地保护数字化治理综合监管平台，启动无人机自动巡查，10分钟内精准定位取证，并判断为正常作业，解除预警，快速实现闭环。面对耕地“非粮化”“非农化”等监管难点，监利市自然资源和规划局牵头建设耕地保护…

记者付文超 6月26日消息，中国电信正式推出了全新的麦芒40 AI手机，这款手机最大的亮点就是首发搭载基于中国电信自研平台开发的“星小辰智能体”，深度融合AI技术于日常使用场景中，实现从功能工具到…

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在6月24日举行的2025阿里云中企出海峰会·深圳上表示，阿里云将加速打造全球云计算一张网，在全球每个节点部署全栈AI能力，增强出海合规、服务和生态团队建设，…

他作为第一作者发表的ResNet论文《Deep Residual Learning for ImageRecognition》，是21世纪被引次数最多的论文。除了ResNet之外，何恺明还曾发表多项极具学…

微软要求删除合同中允许OpenAI在达成AGI时终止技术授权的关键条款，但截至2025年5月谈判仍陷僵局，而这可能危及OpenAI计划的史上最大规模IPO。与此同时，据参与交易谈判的一位人士称，微软拒绝了O…

小红书运营涵盖选题、标题撰写、内容模型构建、封面设计、热点追踪及流量运营等多方面，以下从这些关键环节进行总结。流量运营中，发现页流量占比70%- 80%，其推荐基于用户浏览喜好等，运营时要建立选题库、重视…

#奥尔特曼称ChatGPT不止是谷歌替代品#【OpenAI 奥尔特曼：ChatGPT 的功能已经远不止是“谷歌替代品”】6 月 26日消息，据外媒 Windows Central 25 日报道，在 Open…

报道称，OpenAI倾向于采用“功能主义”定义，即以系统实际能力（如通过图灵测试变体、解决复杂科学问题）作为AGI判定依据；而微软则主张“渐进式评估”，认为AGI应分阶段定义，避免OpenAI过早触发技术限…

6月26日消息，据华尔街日报报道，全球科技巨头Meta Platforms（NASDAQ:META）在人工智能领域的人才争夺战中再下一城，成功从OpenAI挖走三名重量级研究员，进一步加剧了AI行业的技术竞争…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.