谷歌正在推进一项新功能开发,旨在让旗下人工智能模型Gemini具备直接操控安卓手机的能力。这项被称为“屏幕自动化”的技术,目前已在谷歌应用17.4测试版中露出端倪。根据代码解析,该功能内部代号为“倭黑猩猩(bonobo)”,其核心是通过模拟用户操作,在指定应用中完成诸如订餐、预约出行等复杂任务。
技术实现层面,Android 16 QPR3系统更新已为这项功能搭建了基础框架。从测试版代码中发现的字符串显示,用户将看到“借助Gemini完成任务”的提示选项,系统会明确告知该功能可能存在操作失误风险,并要求用户对AI执行的操作承担最终责任。为保障安全性,用户可随时中断AI操作并手动接管控制权。
隐私保护机制是该功能的重点设计方向。当Gemini与应用交互时,若用户开启活动记录功能,系统截取的屏幕画面将经过脱敏处理后用于服务优化,但明确禁止在对话界面输入账号密码或支付信息。开发团队特别提醒,涉及紧急事务或敏感数据的操作不应依赖此功能完成。
在同期测试的功能中,另一个代号为“芥末(wasabi)”的数字形象系统引发关注。该功能与谷歌Meet通话中使用的3D虚拟形象技术同源,允许用户创建个性化数字分身。代码中包含“形象就绪”“重新拍摄”等操作指令,并强调用户对其数字形象拥有独家使用权,系统将通过生物识别等技术防止形象被盗用。
目前这些功能仍处于实验室阶段,具体上线时间尚未公布。行业观察人士指出,屏幕自动化技术的突破可能重新定义移动端人机交互方式,但操作准确性、隐私合规性以及责任界定等问题,仍需通过持续迭代来解决。










