2026 年 3 月 25 日消息,Anthropic 旗下 Claude Code 今日正式推出 Auto Mode 模式,这一升级让 Claude 能够自主判断代码操作的安全性:安全操作直接执行,存在风险的操作则自动拦截并询问用户意见,彻底终结了以往“每一步都要手动确认”的繁琐体验以及“危险驾驶”模式。
Auto Mode 并非简单“全放行”与此前需要用户逐一审批的保守模式不同,Auto Mode 在 Claude 每次尝试执行操作前,都会先经过一道专属分类器模型的严格审查。该分类器会实时评估潜在风险,确保 AI 在高效执行的同时保持安全边界。
四大核心风险自动拦截分类器重点扫描以下四类高危行为:
大规模文件删除
敏感数据外泄
恶意代码执行
提示注入攻击(即恶意指令隐藏在 AI 正在处理的内容中)
优先级决策逻辑清晰高效系统采用分层决策机制:
首先检查是否存在明确的拦截规则(soft_deny);
其次查看是否有明确允许规则(allow);
最后评估用户意图是否足够清晰。
若 Claude 多次尝试被拦截的操作,系统将自动弹出窗口提醒用户介入,确保最终控制权始终掌握在用户手中。
此次 Auto Mode 的上线,标志着 Claude Code 在代码智能体领域再次实现突破性进展。开发者们将能更专注业务逻辑,而无需在安全确认环节消耗过多精力。AIbase 将持续关注该模式上线后的实际表现,并第一时间带来更多深度评测。











