滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

谷歌Gemini 2.5计算机使用模型亮相：为AI智能体赋予GUI交互新能力

时间：2025-10-08 12:48:36 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

谷歌近日宣布推出Gemini 2.5计算机使用模型，这是一款基于Gemini 2.5 Pro视觉理解与推理能力打造的专用工具，旨在让AI智能体具备直接操作图形用户界面（GUI）的能力，包括点击、输入文字和滚动屏幕等人类操作。

开发者现已可通过Google AI Studio和Vertex AI中的Gemini API访问该模型的公开预览版。相关文档已同步上线，开发者可参考链接了解具体使用方法。

谷歌指出，当前AI模型主要通过结构化API与软件交互，但许多日常数字任务仍需直接操作图形界面，例如填写表单、提交信息等。这类任务要求AI智能体能像人类一样浏览网页和应用程序，而原生支持表单填写、下拉菜单操作和登录后操作的能力，是构建通用型智能体的关键突破。

该模型的核心功能通过Gemini API新增的computer_use工具实现，采用循环运行机制。其工作流程分为四步：首先接收用户请求、屏幕截图和操作历史作为输入，开发者可指定排除某些操作或添加自定义函数；随后模型分析输入并生成UI操作指令，如点击或输入；客户端代码执行操作后，将新的屏幕截图和URL反馈给模型，形成持续迭代，直至任务完成或因安全、用户决策等原因终止。

技术文档显示，该模型特别针对Web浏览器环境优化，同时在移动UI控制任务中展现出潜力，但尚未适配桌面操作系统级别的深度控制。

性能测试表明，Gemini 2.5计算机使用模型在多个Web和移动控制基准测试中表现优异。在Browserbase平台的Online-Mind2Web测试中，该模型在浏览器控制质量和响应延迟方面均领先于市场主流方案。

针对AI控制计算机可能引发的安全风险，谷歌构建了多层次防护体系。模型训练阶段即融入安全功能，重点防范三类核心威胁：用户滥用、意外行为及Web环境中的提示注入攻击。开发者可通过两项安全控制工具进一步约束模型行为：逐步安全服务会在每次操作前进行独立评估，系统指令功能则允许开发者设定高风险操作（如绕过验证码、控制医疗设备）的拒绝或用户确认规则。

这些安全措施旨在帮助开发者规避系统破坏、安全威胁等高风险行为，确保AI智能体在合规框架内运行。

更多>同类资讯

「8小时生999娃」AI漫剧被官媒曝光后：火速下架！

04-17

AI可以自审代码了，Opus 4.7出手解决“屎山”

04-17

AI智能体“越用越懂你”智谱AutoClaw上线自进化机制

04-17

美国载人绕月任务机组人员：月球基地计划“绝对可行”

04-17

报告称半数美国员工已在工作中使用AI

04-17

魏哲家回应英特尔竞争挑战：台积电提供最佳芯片封装方案，CoWoS月产能2027冲刺17万片

04-17

Claude Opus 4.7 发布：更费token了，用户评价两极

04-17

AI算力需求激增中际旭创一季度营收净利双双大幅增长

04-17

奈飞Q1财报喜忧交织：营收超预期但指引放缓，创始人离任引市场波动

04-17

郑州银行2025年"答卷"：经营质效稳步提升，财富品牌不断升级

04-17

郑州银行2025年的"平衡法则"：稳中见韧量质双升

04-17

存储大牛股突遭减持，多名股东纷纷“跑路”！

04-17

巴西总统卢拉：特朗普“不是世界皇帝”，不能总是以战争威胁其他国家

04-17

美国移民与海关执法局代理局长将离职

04-17

发改委：预计到2035年非化石能源供应规模比2025年实现倍增

04-17

点击查看更多 +

全站最新

高德机器狗街头亮相：等红灯避行人，还能进店自主取奶茶

存储大牛股突遭减持，多名股东纷纷“跑路”！

A股商业航天股集体上涨，蜀道装备、华光新材涨超7%

A股锂矿股多数上涨，西藏珠峰、融捷股份涨超6%

港股异动丨粤港湾控股大涨超10%，股价创逾8年新高，核心业务盈利性落地获验证

A股异动丨3月地产销售量价边际改善，地产股集体走强，新城控股涨超4%，招商蛇口涨超3%

热门内容

本栏最新

A股商业航天股集体上涨，蜀道装备、华光新材涨超7%

A股锂矿股多数上涨，西藏珠峰、融捷股份涨超6%

海军“亚伯拉罕·林肯”号航空母舰(CVN72)4月16日在阿拉伯海执行美国封锁行动

速腾聚创发布"凤凰"预告，神秘芯片剑指2160新纪元

港股异动丨内房股多数上涨，金辉控股涨7.8%，一季度楼市销售降幅收窄

当乳业进入"科技时代"，飞鹤以"原料自研、鲜活标准、全龄布局"给出答案

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.