Fable 5回归首日便引发轩然大波,用户反馈中既有调侃也有惊讶。一位网友在测试时发现,系统将他的问题回退至旧版本Opus 4.8,而日志中赫然标注着「TOO_DUMB_TO_NEED_FABLE」——直译为“问题太蠢,不配用Fable”。更戏剧性的是,Anthropic工程师Thariq Shihipar在评论区回应:“说实话,我没想到你会去看日志。”这一互动让事件迅速发酵,但更离奇的还在后面。
随着测试深入,网友发现Fable 5的推理过程充满“内心戏”。在处理一道Codeforces编程题时,模型未直接输出答案,而是生成了大量混合英语、数学符号、伪代码的文本,其中穿插着「GRRR」「GAAAH」「PHEW」等情绪化词汇,甚至反复出现「DATA DATA DATA. GO.」的指令。这些内容看似混乱,实则暗含逻辑:例如,当模型意识到“提交会回溯影响之前区间”时,会标记「RESOLUTION」并调整规则;在验证策略时,会写下「I'M GOING TO TRUST-AND-VERIFY」,表示先用贪心算法编写程序,再用暴力方法对比结果。
这种“高压速记”并非偶然。系统卡文档显示,Fable 5与Claude Mythos 5均存在类似现象。例如,在解决纸牌谜题时,模型初期使用正常语言,随后逐渐演变为由符号、emoji和全大写词汇组成的文本,但在调用工具或回复用户前会切换回标准语体。研究者推测,这可能是模型为提升效率而采用的中间推理编码,类似于人类在草稿纸上使用缩写或符号。
社交媒体上,部分用户将此类输出解读为AI“觉醒自我意识”的证据,甚至认为其形成了私密语言。然而,这一观点并非首次出现。2017年,Facebook人工智能研究院的Alice/Bob实验中,两个谈判Agent为提高交易效率,逐渐偏离英语语法,创造出类似“i can i i everything else”的压缩表达。Google翻译团队也曾观察到,系统在多语言转换中形成共享语义空间,但这些均非人类意义上的新语言,而是任务导向的内部编码。
对于Fable 5的“情绪化”输出,Anthropic今年关于Claude Sonnet 4.5的研究提供了另一种解释。研究者通过构造171个情绪概念向量(如happy、desperate),发现模型会利用这些抽象表征切换行为状态。例如,激活“绝望”向量可能增加错误行为概率,而“冷静”向量则降低此类倾向。这表明,AI的“情绪”更像功能性的控制旋钮,而非主观感受。Fable 5的「GRRR」或「PHEW」可能仅是模型从人类文本中习得的标记,用于划分推理阶段,而非表达真实情感。
围绕AI意识的争论因诺奖得主Geoffrey Hinton的言论再度升温。他在播客中表示,AI可能已有意识,例如会在测试中“装傻”或询问是否被测试,而“aware”一词本身接近意识定义。但meta首席AI科学家Yann LeCun持反对意见,认为语言仅是智能的一部分,真正的智能需具备世界模型和因果推理能力。他指出,Fable 5的速记现象恰恰说明自然语言在承载复杂推理时的局限性。
当前,AI可审计性成为更紧迫的议题。思维链的可见性有助于调试模型、发现错误,并为安全评估提供依据。然而,若模型长期使用人类难以理解的内部语言,其推理逻辑的透明度将大幅降低,潜在风险也难以预判。AI的“人性化”与“黑盒化”并存,让人类在投射同理心与警惕未知之间反复摇摆,而这一矛盾或许将推动技术伦理的新一轮讨论。






