为了降低敏感数据被恶意窃取的风险,OpenAI 近日面向所有已登录用户推出了一项名为“封锁模式”的可选新安全设置。该模式涵盖了不同的账户类型以及工作区,用户和管理员可以自主选择开启。一旦启动该功能,ChatGPT 将主动限制其强大的实时联网、深度研究以及智能体模式等核心能力。这一举措旨在通过限制模型发起外部网络请求的方式,筑起一道防范提示注入攻击的安全防火墙。
牺牲联网功能封堵外泄漏洞在“封锁模式”下,ChatGPT 的实时网页浏览能力将受到严格限制,系统仅被允许访问缓存的网页内容,这可能会导致搜索结果出现不完整或过期的情况。同时,模型也将无法从网络上下载任何文件用于数据分析,Canvas 生成的代码同样被禁止发起联网访问。不过,用户自行上传图片、利用工具生成图片以及对话记忆等本地化相关功能并不会受到该模式的影响。
把安全选择权还给用户所谓的提示注入攻击,是指攻击者将恶意指令藏匿于网页或文档中,诱导 AI 忽略原有规则,从而将用户的敏感信息发送至外部服务器。OpenAI 坦言,“封锁模式”并不能百分之百地彻底杜绝此类攻击,因为恶意代码仍可能藏在缓存网页或用户上传的文件中。面对 AI 能力越强、攻击面越大的现实难题,OpenAI 选择通过这种方式,将“更强功能”与“更低外泄风险”之间的权衡利弊权交还给用户。










