人工智能研究机构Anthropic近日推出两款新型人工智能模型——Claude Fable 5和Claude Mythos 5,引发科技界广泛关注。这两款模型基于同一底层架构开发,但在安全防护机制和应用场景上存在显著差异。
Claude Fable 5作为面向大众的通用版本,配备了先进的安全分类系统。当用户提出涉及网络安全、生物化学等敏感领域的问题时,模型会自动切换至性能稍弱的Claude Opus 4.8版本进行回答。这种设计既保证了日常使用的效率,又有效控制了潜在风险。数据显示,超过95%的用户交互不会触发安全机制,在这些常规场景中,Fable 5的性能与无限制版本完全一致。
与之形成对比的是Claude Mythos 5,这个专为特定领域专家设计的版本移除了相关安全限制。目前该模型主要面向两类用户:参与"玻璃翼计划"的网络安全防御者和即将加入可信访问计划的生物学研究人员。Anthropic特别强调,Mythos 5的访问权限将严格审核,仅限于防御性网络安全工作。
在技术性能方面,Fable 5展现出显著优势。支付巨头Stripe的测试表明,该模型能在24小时内完成原本需要两个多月的人工代码库迁移工作。基准测试显示,在SWE-bench Pro评估中,Fable 5得分达到80.3%,远超GPT-5.5的58-60%和Claude Opus 4.8的50-55%。在智能体编程测试中,Fable 5同样表现卓越,特别是在FrontierCode Diamond基准测试中取得29.3%的成绩,几乎是Claude Opus 4.8的两倍。
视觉处理能力的提升是Fable 5的另一大亮点。该模型不仅能准确识别图表数据,还能根据截图重建网页源代码。内部测试显示,Fable 5仅凭视觉框架就成功完成了经典游戏《宝可梦·火红》的通关挑战。在卡牌构筑游戏《杀戮尖塔》测试中,赋予持久记忆能力后的Fable 5性能提升幅度是前代模型的三倍。
Mythos 5在科学领域展现出惊人潜力。蛋白质设计专家利用该模型将药物研发流程加速约十倍,在14个蛋白质靶点中有9个产生了有前景的药物设计候选。基因组学研究中,Mythos 5自主梳理了138个物种的单细胞数据,设计出的机器学习模型性能超越《科学》杂志近期发表的成果,且模型规模缩小100倍。
安全机制设计方面,Anthropic采取多层次防护措施。所有Mythos级模型的交互数据将保留30天,仅用于安全分析,不会训练新模型。系统会记录所有人工数据访问,并在30天后自动删除。在网络安全测试中,Mythos 5在ExploitBench基准测试中取得78.0%的高分,显著优于前代模型。
访问权限管理上,Anthropic建立严格审核机制。Fable 5已全面开放使用,订阅用户可在6月22日前免费体验。Mythos 5仅限通过审核的机构使用,目前"玻璃翼计划"已吸引约200家机构参与,涵盖电力、医疗、通信等关键基础设施领域。开源项目维护者可通过专门程序申请访问权限。
定价策略显示,Fable 5和Mythos 5的输入输出成本分别为每百万token 10美元和50美元,虽较预览版降价近半,但仍属行业高端价位。Anthropic表示,若系统容量允许,将延长免费体验期并尽快将Fable 5纳入标准订阅套餐。
行业对这次发布反应不一。有投资人认为,Anthropic通过品牌命名策略成功转移了用户对模型代际的关注。也有批评声音指出,该机构的安全主张更多是产品包装手段。这场争论反映出人工智能技术在商业应用与伦理安全之间的持续博弈。










