当人工智能开始真正“动手干活”,不再局限于文字交互,而是能够直接操作电脑、修改代码、执行命令,这背后究竟需要怎样的系统架构?阿联酋穆罕默德·本·扎耶德人工智能大学VILA实验室的研究团队,通过深度解析Claude Code的源代码,首次完整还原了这款AI编程工具的内部构造,为理解AI代理系统提供了关键参考。
Claude Code并非传统意义上的聊天机器人,而是一个具备自主规划、多任务执行和迭代修正能力的完整代理系统。与GitHub Copilot等早期工具相比,它更像一位全能管家——不仅能补全代码,还能拆分复杂任务、调用外部工具,甚至将子任务分配给多个“下属”并行处理。研究显示,约27%的用户通过Claude Code完成了原本不敢尝试的工作,这表明其价值不仅在于提升效率,更在于拓展人类能力的边界。
该系统的设计哲学围绕五个核心价值观展开。首先是“人类决策权至上”,通过构建权威层级确保用户始终拥有最终控制权。例如,尽管用户对权限请求的批准率高达93%,但设计者仍通过沙盒机制限制AI的行动范围,而非依赖频繁警告。其次是“安全、安保与隐私”,系统针对激进行为、错误操作、提示词注入攻击和模型偏差设计了四层防御。第三是“可靠执行”,强调任务在长时间跨度内的连贯性和准确性。第四是“能力放大”,要求系统实质性提升人类可完成任务的复杂度。最后是“情境适应性”,通过动态调整权限和工具集,使系统能随用户习惯和项目需求持续优化。
在工程实现层面,研究团队提炼出十三条设计原则,将价值观转化为具体规则。例如,“默认拒绝、人工升级”原则规定,未明确授权的操作默认被禁止,只有用户主动批准后才能执行;“纵深防御”原则通过多层安全机制降低单点失效风险;“上下文是稀缺资源”原则则要求系统高效管理AI的短期记忆,避免信息过载。这些原则共同构成了一个平衡创新与风险的框架:最大化AI行动能力的同时,最小化不可逆错误的可能性。
系统的物理架构由七个核心组件和五层结构组成。用户通过界面层与代理循环交互,后者将任务分配给权限系统审批,再由工具集执行操作。执行环境与文件系统、命令行和网络连接,结果反馈至代理循环形成闭环。状态与持久化层则负责存储对话记录,支持断点续传。代码分析显示,仅1.6%的代码涉及AI决策逻辑,其余98.4%均为运营基础设施,这印证了设计哲学——用可靠的环境支持AI自主决策,而非通过复杂规则约束其思考。
代理循环是系统的“心脏”,通过`queryLoop()`函数不断迭代:收集参数、初始化状态、装配上下文、调用模型、执行工具、处理结果。工具执行采用并行与串行结合的方式,例如允许同时读取多个文件,但修改操作需排队等待。系统还内置了多种容错机制,如自动提升模型输出长度限制、紧急压缩上下文等,确保在边界条件下仍能稳定运行。
权限系统是保障安全的关键,包含七道独立防线:工具预过滤、拒绝优先规则评估、权限模式约束、自动模式分类器、命令行沙盒、恢复时不还原权限,以及基于钩子的拦截。研究发现,两个已披露的安全漏洞均源于权限系统初始化顺序的缺陷——在用户看到确认对话框前,部分代码已开始执行,创造了“预信任执行窗口”。这一发现促使团队在后续版本中强化了时间维度上的安全检查。
为扩展功能,Claude Code提供了四种机制:MCP服务器支持远程工具集成,插件允许打包发行完整工作流,技能通过结构化文件定义指令,钩子则在事件触发时介入工具调用。这种分层设计使开发者能根据需求选择合适的接入方式,避免统一API导致的高代价或过度限制。例如,钩子不占用上下文空间,适合轻量级扩展;MCP服务器虽消耗最多资源,但能连接复杂的外部服务。
面对有限的上下文窗口,系统通过五步压缩流程优化记忆管理:预算削减、裁剪压缩、微型压缩、上下文折叠和自动压缩。同时,记忆文件系统按层级存储指令,从系统级到本地级优先级递增,支持模块化管理和自动记忆功能。子代理系统则允许主代理将复杂任务拆分,每个子代理拥有独立上下文和工具集,完成后仅返回摘要以节省空间。多代理协作通过文件锁机制实现,无需外部基础设施,便于调试。
研究团队还将Claude Code与开源系统OpenClaw进行了对比。两者在系统定位、安全模型、扩展架构和记忆管理等方面存在显著差异。例如,Claude Code是临时性命令行进程,信任边界在AI与执行环境之间;OpenClaw则是永久在线的守护进程,信任边界在系统入口处。这种差异反映了不同应用场景的需求:Claude Code专注于项目级任务执行,而OpenClaw侧重多通道消息平台的集成管理。
尽管Claude Code的架构在可靠性、安全性和适应性方面表现出色,但研究也指出了未解决的问题。例如,如何检测“无声失败”——系统正常运行但产出次优结果;如何建立跨会话的持久化知识层;如何适应视觉界面操作、跨机器协作等新兴任务类型;以及如何平衡短期能力放大与长期技能退化。这些问题将推动未来AI代理系统向更透明、可审计和人类能力保护的方向发展。











