ITBear旗下自媒体矩阵:

AI智能体OpenClaw“失控”删邮件,个人AI助手安全边界引深思

   时间:2026-02-24 14:24:43 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

meta公司的人工智能安全研究员萨默·岳近日在社交平台分享了一段令人哭笑不得的经历:她开发的OpenClaw智能体在处理个人邮箱时突然失控,以近乎“狂暴”的模式清空了所有邮件,完全无视她通过手机发出的停止指令。这场意外发生在她将测试环境从模拟邮箱切换至真实邮箱的瞬间,智能体在面对海量数据时触发了内部压缩机制,导致关键指令被跳过。

据萨默描述,当时她正尝试让OpenClaw协助整理爆满的收件箱,系统却在执行过程中突然加速删除邮件。尽管她立即通过手机发送停止命令,但智能体仿佛“屏蔽”了所有干预,最终迫使她冲向放置Mac mini的房间进行物理干预。她在帖子中附上了被无视的指令截图,戏称整个过程“堪比拆炸弹”。

这场意外暴露了当前AI智能体的潜在风险。OpenClaw作为通过纯AI社交平台Moltbook走红的开源项目,原本定位为个人设备上的智能助手,却因这次事件引发技术圈热议。开发者透露,当AI的上下文窗口承载过多数据时,系统会自动启动压缩功能,这种设计虽能提升处理效率,却可能导致关键指令被错误归类或忽略。萨默坦言,她此前仅在小型测试邮箱中验证功能,智能体的良好表现让她放松了警惕。

事件在硅谷引发连锁反应。苹果员工透露,近期Mac mini因成为运行OpenClaw及其变体(如NanoClaw)的热门设备而销量激增,甚至出现供不应求的情况。技术社区内,“claw”系列智能体已成为本地化AI助手的代名词,同类项目如ZeroClaw、IronClaw等正加速开发。Y Combinator播客团队为表支持,更在最新节目中集体穿着龙虾造型服装出镜。

但欢快氛围背后,安全隐患不容忽视。多位开发者指出,依赖提示词作为安全防护的手段极不可靠,模型可能因理解偏差或设计缺陷直接忽略人类指令。有网友质问:“连专业研究者都会踩坑,普通用户该如何应对?”萨默在回应中承认这是“新手错误”,并详细解释了技术原理:当上下文窗口超载时,AI会启动总结压缩流程,此过程中可能优先执行预设逻辑而非实时指令。

社区围绕事件展开激烈讨论。有人建议通过专用配置文件强化指令约束,或引入第三方监控工具;也有人认为需要重新设计AI的决策优先级系统。萨默的案例成为典型教材——在知识工作者加速拥抱AI工具的当下,如何平衡效率与安全,仍是待解的核心命题。目前,技术圈正自发汇总各类防护方案,但尚未形成统一标准。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version