ITBear旗下自媒体矩阵:

Anthropic Fable安全护栏引争议:专业用户质疑“一刀切”限制过严

   时间:2026-06-11 12:15:36 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能公司Anthropic推出的新模型Fable近日在网络安全领域引发广泛讨论。这款被定位为高端安全模型Mythos“公共受限版”的产品,因内置的安全限制机制过于严格,导致专业用户在实际使用中遭遇诸多阻碍。多名研究人员指出,Fable对涉及网络安全内容的识别标准近乎苛刻,甚至将常规技术任务也纳入限制范围。

根据用户反馈,该模型的安全过滤系统会拦截绝大多数与网络安全相关的查询请求。IBM X-Force安全专家Valentina Palmiotti在测试中发现,当用户请求阅读技术博客文章时,系统会直接终止对话并提示“检测到网络安全或生物学相关内容”。这种过度敏感的过滤机制,使得模型在处理软件工程、代码优化等基础任务时也频繁触发安全限制。

Mythos模型自今年春季推出以来,始终采用定向开放策略。通过“Project Glasswing”计划,Anthropic仅向特定企业和机构提供服务,重点支持关键基础设施防护。近期该公司将服务范围扩展至15个国家的数百家机构,试图推动高阶安全模型在能源、金融等领域的落地应用。然而Fable作为面向公众的简化版本,其安全策略却引发专业群体强烈质疑。

网络安全从业者Matt Suiche分析指出,Fable的判断逻辑存在明显缺陷。当用户提出“编写安全代码”这类常规需求时,系统会将其归类为网络安全操作而非软件工程实践,从而自动切换至基础模型 Claude Opus 4.8。这种依赖关键词匹配的过滤方式,导致大量合法请求被错误拦截,严重影响了模型在专业场景中的实用性。

尽管存在诸多争议,部分专家对Anthropic的保守策略表示理解。Suiche认为,在模型发展初期设置严格的安全阈值,有助于降低技术滥用风险。他预测随着与专业安全机构的合作深化,这些限制机制将逐步优化调整。这种“先紧后松”的管控模式,相比初期放任可能带来的风险更具可控性。

社交媒体上的讨论显示,Fable的过滤机制已影响多项核心功能。有研究人员尝试进行代码审查时触发安全警报,另有用户在Reddit社区反馈,安全审计、漏洞分析等关键任务均被系统拒绝。截至目前,Anthropic尚未就这些技术反馈作出公开回应。

为平衡功能开放与风险管控,Anthropic同步推出了“网络安全验证计划”。通过该认证的用户可获得更宽松的使用权限,在特定条件下解除部分限制。这种双轨制策略与OpenAI的“Trusted Access for Cyber”项目形成呼应,反映出AI企业在赋能网络安全领域时,普遍采用技术过滤与人工审核相结合的管控模式。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version