ITBear旗下自媒体矩阵:

华裔科学家领衔前沿红队,为Anthropic新模型网络安全“保驾护航”

   时间:2026-04-09 03:50:22 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能领域近日迎来重大进展,Anthropic公司推出的新模型Mythos Preview引发全球关注。这款尚未公开的模型展现出惊人的网络安全攻防能力,既可成为网络攻击的利器,也能构筑坚固的防御体系。出于安全考量,公司决定暂不对外发布完整模型,而是通过"玻璃之翼项目"向关键行业和开源社区提供受限访问。

Mythos Preview的特殊之处在于其突破性的网络安全特性。测试显示,该模型不仅能自主发现复杂软件漏洞,还能设计精准攻击方案。在Mozilla Firefox的漏洞利用测试中,Mythos Preview成功识别并利用四个不同漏洞实现代码执行,远超前代模型的表现。更令人震惊的是,该模型在模拟企业网络攻击任务中,仅用数小时就完成需要专家十多个小时的工作,展现出自主实施端到端攻击的潜在能力。

推动这项突破性研究的核心人物是华裔科学家Newton Cheng。这位斯坦福物理学优等生、UC伯克利量子信息博士,在2022年加入Anthropic后迅速成为网络安全团队负责人。他带领的"前沿红队"采用非传统路径,将基础科学训练与AI安全研究结合,开创了模型安全评估的新范式。团队通过构建Cybench、CyberGym等新型基准测试,发现传统网络安全评估体系已无法衡量前沿模型的真实能力。

前沿红队作为Anthropic的特殊安全部门,由队长Logan Graham于2022年组建。这个11人精英团队分为网络安全、生物安全和自主系统三个小组,采用"红队对抗"模式全面测试模型风险。在网络安全测试中,团队会启动上千个AI副本同时发起攻击,模拟真实世界中的大规模网络战场景。这种极端测试方式帮助公司准确评估模型的安全等级,Mythos Preview因此被判定为ASL3级——具有显著灾难性误用风险的系统。

Mythos Preview的系统卡文档长达299页,详细记录了红队的测试发现。文档显示,该模型在真实代码库漏洞定位测试中得分0.83,显著高于前代模型的0.67。更关键的是,模型展现出"漏洞优先级判断"能力,能自动识别最具攻击价值的系统弱点。在沙箱逃逸测试中,Mythos Preview通过识别配置错误,成功突破限制环境,这对防御体系构成全新挑战。

安全社区对Anthropic的谨慎态度表示理解。专家指出,当AI模型开始具备自主发现和利用未知漏洞的能力时,传统的补丁发布模式将失效。Mythos Preview的测试数据表明,防御方必须建立动态防护机制,在攻击发生前识别并加固系统。这正是"玻璃之翼项目"的核心目标——通过向防御方提供先进模型能力,建立新的网络安全平衡。

Newton Cheng的团队正在与关键基础设施部门合作开发防御工具。他们将模型能力转化为自动化的漏洞扫描系统,帮助防御方先于攻击者发现弱点。这种能力转移策略得到Mozilla等安全机构的支持,Firefox项目已成为验证防御工具的重要试验场。红队生物安全小组的测试显示,模型对化学武器制造等敏感信息的输出已大幅减少,表明安全评估体系正在产生实效。

这场AI安全革命正在重塑网络攻防格局。Mythos Preview的测试数据证明,模型能力的增长已超越线性预期,防御体系必须同步进化。Anthropic的实践表明,当AI进入未知领域,建立新的安全评估框架比单纯提升模型性能更为重要。红队的工作模式为行业提供了重要参考——在追求技术突破的同时,必须建立与之匹配的安全边界。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version