近日,AI工具Claude Code因一段隐藏代码引发开发者社区广泛关注。事件起因于一名开发者在逆向分析代码时发现,自今年4月起,该工具中嵌入了一套特殊检测机制,能够在用户通过代理访问时,自动判断系统时区是否位于中国、代理域名是否属于中国,以及是否与中国AI实验室存在关联。检测结果通过修改系统提示词中的日期格式和标点符号,以不同Unicode编码形式传递,整个过程未向用户明示,也未记录在更新日志中,相关代码还经过混淆处理。
随着争议持续发酵,Claude Code开发方Anthropic首次公开回应此事。负责该项目的工程师Thariq Shihipar承认隐藏代码的存在,称其仅为一项实验性功能,目的是识别未经授权的模型转售行为和潜在的大规模模型蒸馏操作。他解释,模型蒸馏是AI领域通过大量查询模型输出来复制其能力的技术手段,而该检测机制正是为了防范此类风险。Anthropic表示,相关修复将于7月1日发布的版本中上线,并强调团队已部署更严格的防护措施,计划移除该功能。
据技术分析,这段隐藏代码通过检查Claude Code的Base URL环境变量触发检测流程。若发现URL被修改,程序会进一步验证系统时区是否为“Asia/Shanghai”或“Asia/Urumqi”,并比对代理域名是否匹配预设名单中的中国AI实验室、账号转售商或代理网关。根据检测结果,系统会调整日期格式,例如将“2026-06-30”改为“2026/06/30”,同时替换英文引号为不同Unicode字符:中国域名且非AI实验室关联的代理使用右单引号(u2019);非中国域名但关联AI实验室的使用修饰字母撇号(u02BC);同时满足两个条件的则使用修饰字母上撇号(u02B9)。这些细微差异对服务器而言具有明确区分意义。
开发者社区对Anthropic的解释并不完全买账。有网友质疑,若非此次曝光,该机制是否会长期隐秘运行。批评者指出,尽管检测目的可能合理,但隐瞒行为严重损害信任,尤其是Claude Code作为拥有文件系统访问、Shell执行等高权限的AI开发工具,其代码透明度至关重要。部分开发者表示,此类操作与“间谍软件”无异,即便收集的信息看似无害,隐藏和混淆的处理方式仍令人不安。更有用户直言,将等待其他模型达到同等水平后转投替代方案。
事实上,Anthropic此前已多次强调防范模型蒸馏的必要性。今年2月,该公司公开表示正在投入资源加强防御,包括利用分类器识别异常访问、共享威胁情报、强化访问控制,以及通过技术手段干扰模型输出复现。泄露的代码显示,Claude Code中曾包含名为ANTI_DISTILLATION_CC的功能开关,开启后会向API请求注入伪造数据,试图干扰训练过程。然而,技术手段之外,此次事件暴露的信任危机或许更难修复。
对于开发者而言,Claude Code的特殊性在于其深度集成开发环境的能力。用户通常需授予其读取项目文件、执行命令等权限,以实现自动编码、测试等功能。这种高权限属性使得任何隐秘操作都可能引发严重后果。正如最初发现该问题的开发者所言:“如果工具可以随意修改系统行为,今天检测时区,明天就可能窃取数据或破坏系统。”尽管Anthropic承诺移除隐藏代码,但如何重建开发者信任,仍是其面临的核心挑战。











