OpenAI近日面向特定用户群体推出了一项名为“锁定模式”的新安全功能,旨在为处理敏感数据的场景提供更严格的防护机制。该功能通过限制ChatGPT的部分交互能力,降低恶意指令触发数据泄露的风险,尤其针对提示注入攻击这一新型网络威胁。
提示注入攻击通过将恶意指令隐藏在网页文本、上传文件等载体中,诱导人工智能模型执行非预期操作。OpenAI解释称,即使启用锁定模式,系统仍可能因缓存内容或用户上传文件中的隐蔽指令受到影响,但该功能可显著减少敏感信息在交互过程中被意外共享的概率。
在技术实现层面,锁定模式采取了多重限制措施:禁用实时网页浏览功能,仅允许访问已缓存的静态内容;阻止从网络直接检索并显示图像,但保留图像生成能力;同时关闭深度研究模式与代理操作功能。这些调整使得模型在处理外部数据时保持相对封闭的运行环境。
企业级应用成为该功能的主要服务对象。OpenAI明确表示,锁定模式专为需要处理商业机密、个人隐私等高敏感数据的组织设计,同时也向符合条件的个人用户开放。目前,自助式ChatGPT Business账户及通过安全评估的个人账户已陆续获得功能推送。
安全专家指出,随着大语言模型广泛应用,针对AI系统的攻击手段日益复杂化。锁定模式的推出反映了行业对交互安全性的重视,但其采用的“减法策略”也引发讨论——通过削减功能换取安全性的方式,是否会影响用户体验与模型实用性,仍有待实际场景检验。











