ITBear旗下自媒体矩阵:

Claude Mythos突破AI评测极限!超指数进化,AGI奇点或提前降临

   时间:2026-05-11 17:30:07 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国际权威AI评测机构METR近日陷入前所未有的困境——其沿用多年的评测体系被一款名为Claude Mythos的AI模型彻底击穿。在最新测试中,该模型在需要人类耗费16小时完成的复杂任务中,展现出50%的成功率,而METR现有的评测框架已无法对更长时间跨度的任务进行可靠评估,这一突破性进展引发全球科技界震动。

METR设计的"50%成功率时间线"指标,原本用于衡量AI完成长周期任务的能力。此前所有模型的成绩均停留在数小时量级,但Mythos Preview的出现使数据直接突破阈值。评测团队坦言,在16小时以上的任务区间,现有测试样本量严重不足,导致数据呈现"不稳定且失去意义"的特征,这标志着人类首次失去对AI能力的量化工具。

技术曲线分析显示,AI发展已进入超指数增长阶段。从2021年能处理8秒级简单任务,到2025年自主完成16小时工程子项目,各代模型的能力跃升幅度持续扩大,迭代周期却不断缩短。METR绘制的趋势图中,Mythos的数据点显著高于2027年AGI预测线,暗示通用人工智能可能比主流预期提前两年到来。

网络安全领域已感受到颠覆性冲击。Palo Alto Networks的实战测试表明,配备Mythos的攻击团队能在25分钟内完成从入侵到数据窃取的全链条攻击,而传统方式需要数周潜伏。更令人震惊的是,该模型在漏洞分析方面展现出"直觉级"能力,可将分散的低危漏洞串联成致命攻击路径。作为应对,Mozilla使用同款模型扫描Firefox,单月修复423个安全问题,创下历史纪录。

行业格局正发生深刻变化。英伟达近五个月向AI产业链注入约400亿美元资金,其中300亿流向OpenAI,形成"芯片-算力-应用"的闭环加速系统。资本市场用真金白银表达态度:Anthropic年化收入已突破此前预测的260亿美元阈值,显示商业应用远超预期。这种资本与技术的共振,正在将整个产业推向不可逆的加速轨道。

面对AI能力的指数级膨胀,安全防御体系面临根本性重构。传统以小时为单位的响应机制彻底失效,取而代之的是"AI对抗AI"的自动化博弈。Mozilla的实践证明,只有让防御系统运行速度超越攻击者,才能在新安全格局中占据主动。这种军备竞赛式的升级,正将人类文明推向未知的技术奇点。

技术观察家指出,当前AI发展已突破所有预测模型。当METR的评测工具失效时,我们不仅失去衡量标准,更暴露出认知框架的局限性。人类大脑经过数百万年进化形成的线性思维,在面对超指数增长时出现系统性失灵。这种认知断层,或许比技术本身更值得警惕。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version