近期,不少使用Claude Code的用户发现,该产品体验出现明显下滑,具体表现为回复内容变短、上下文记忆能力减弱、生成的代码质量下降,甚至有用户调侃其“变笨了”。就在用户反馈问题集中出现之际,Anthropic公司正式发布技术报告,对这一现象作出详细说明,指出问题并非模型性能退化,而是由于近期三项产品调整叠加失效所致。公司强调,从未刻意降低模型性能,并宣布重置所有订阅用户的使用额度。
根据报告,第一项问题源于推理难度调整不当。3月初,为解决部分用户在高难度模式下遇到的界面卡顿问题,Anthropic将Claude Code的默认推理难度从“高”下调至“中”。然而,用户普遍反馈更倾向于默认使用更高智能级别,仅在处理简单任务时手动切换至低难度。4月7日,团队撤销了这一更改,恢复原有默认设置,但此次调整影响了Sonnet 4.6与Opus 4.6版本,导致部分用户感知到模型性能波动。
第二项问题与缓存优化漏洞有关。3月26日,Anthropic上线了会话缓存优化功能,旨在通过清除闲置超一小时会话的历史思维记录来降低延迟。然而,程序漏洞导致该清除操作在会话剩余时间内反复触发,造成模型回答重复、工具选择异常,甚至出现“健忘”现象。这一漏洞于4月10日修复,影响范围覆盖Sonnet 4.6与Opus 4.6版本。公司分析认为,该漏洞也是部分用户反馈使用额度消耗异常加快的重要原因。
第三项问题则涉及系统提示调整对代码质量的影响。4月16日,为精简输出冗余,Anthropic新增了一条系统提示,但该指令与其他规则叠加后导致代码生成质量下滑。团队于4月20日撤销了这一提示,此次变更影响了Sonnet 4.6、Opus 4.6及Opus 4.7版本。内部测试显示,该提示对模型能力产生了约3%的负面影响。
报告指出,此次性能波动并非单一原因导致,而是三项独立功能调整叠加的结果,影响范围仅限于Claude Code、Claude Agent SDK及Claude Cowork三款产品,核心API服务未受影响。截至4月20日,相关问题已全部修复。由于三次变更在影响范围与持续时间上存在差异,用户侧表现为“普遍存在但不稳定”的性能下降,增加了排查难度。尽管团队早在3月初便启动调查,但初期难以区分正常波动与异常问题,内部测试环境也未能第一时间复现故障。
为弥补用户体验损失,Anthropic宣布自4月23日起重置所有订阅用户的使用额度。从时间线来看,问题最早可追溯至今年2月。当时,Anthropic在Claude Code中上线Opus 4.6版本,并将默认推理强度设为“高”,以提升模型智能表现。但上线后不久,用户反馈指出高强度模式下模型思考时间过长,带来明显延迟并增加Token消耗。为此,公司对默认设置进行了调整,试图在“思考时间—输出质量—成本”之间寻求平衡,但这一调整很快引发了新的问题。
在缓存漏洞的技术细节方面,报告解释称,正常设计中,Claude完成推理后,其思考过程会被保存在对话历史中,以保持决策的一致性与连贯性。3月26日上线的“提示缓存”机制旨在降低连续API调用成本并提升响应速度,但实际实现中出现了关键性漏洞:推理历史在后续每一轮对话中持续被清除,导致模型逐渐模糊此前执行操作的决策依据。这一问题之所以难以及时发现,主要因其仅在“长时间闲置会话”等极端条件下触发,且两项内部并行实验在一定程度上掩盖了问题表现。
针对系统提示优化的“副作用”,报告提到,随着Claude Opus 4.7发布,模型在复杂任务中的表现显著增强,但输出内容更为详尽,带来更高的Token消耗。为此,团队在系统提示中加入明确的长度限制,但这一改动在后续评估中被发现对模型能力产生负面影响。基于这一结果,公司立即恢复了提示,并表示将从产品使用、研发流程与沟通机制等多个层面进行改进,以避免类似问题再次发生。
在改进措施方面,Anthropic计划扩大内部真实使用场景,确保更多员工直接使用Claude Code的公开版本,以便更早发现潜在问题。同时,公司将升级内部代码审查工具,并逐步开放给开发者使用。在技术流程上,未来每一次针对Claude Code的提示调整,都需要在不同模型上进行全面评估,并通过持续的消融测试来确保稳定性。公司还在相关文档中补充规范,明确不同模型的提示调整边界,避免跨模型干扰。
在外部沟通方面,Anthropic已在社交平台上线专门账号,用于更透明地解释产品决策及其技术背景,并在开发者社区同步更新进展,增强与用户的互动。公司最后表示,此次问题的定位与修复离不开用户的持续反馈,无论是通过反馈渠道提交的问题,还是公开分享的可复现案例,都为排查提供了关键线索。







