滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Claude Mythos突破AI评测极限！超指数进化，AGI奇点或提前降临

时间：2026-05-11 17:30:07 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

国际权威AI评测机构METR近日陷入前所未有的困境——其沿用多年的评测体系被一款名为Claude Mythos的AI模型彻底击穿。在最新测试中，该模型在需要人类耗费16小时完成的复杂任务中，展现出50%的成功率，而METR现有的评测框架已无法对更长时间跨度的任务进行可靠评估，这一突破性进展引发全球科技界震动。

METR设计的"50%成功率时间线"指标，原本用于衡量AI完成长周期任务的能力。此前所有模型的成绩均停留在数小时量级，但Mythos Preview的出现使数据直接突破阈值。评测团队坦言，在16小时以上的任务区间，现有测试样本量严重不足，导致数据呈现"不稳定且失去意义"的特征，这标志着人类首次失去对AI能力的量化工具。

技术曲线分析显示，AI发展已进入超指数增长阶段。从2021年能处理8秒级简单任务，到2025年自主完成16小时工程子项目，各代模型的能力跃升幅度持续扩大，迭代周期却不断缩短。METR绘制的趋势图中，Mythos的数据点显著高于2027年AGI预测线，暗示通用人工智能可能比主流预期提前两年到来。

网络安全领域已感受到颠覆性冲击。Palo Alto Networks的实战测试表明，配备Mythos的攻击团队能在25分钟内完成从入侵到数据窃取的全链条攻击，而传统方式需要数周潜伏。更令人震惊的是，该模型在漏洞分析方面展现出"直觉级"能力，可将分散的低危漏洞串联成致命攻击路径。作为应对，Mozilla使用同款模型扫描Firefox，单月修复423个安全问题，创下历史纪录。

行业格局正发生深刻变化。英伟达近五个月向AI产业链注入约400亿美元资金，其中300亿流向OpenAI，形成"芯片-算力-应用"的闭环加速系统。资本市场用真金白银表达态度：Anthropic年化收入已突破此前预测的260亿美元阈值，显示商业应用远超预期。这种资本与技术的共振，正在将整个产业推向不可逆的加速轨道。

面对AI能力的指数级膨胀，安全防御体系面临根本性重构。传统以小时为单位的响应机制彻底失效，取而代之的是"AI对抗AI"的自动化博弈。Mozilla的实践证明，只有让防御系统运行速度超越攻击者，才能在新安全格局中占据主动。这种军备竞赛式的升级，正将人类文明推向未知的技术奇点。

技术观察家指出，当前AI发展已突破所有预测模型。当METR的评测工具失效时，我们不仅失去衡量标准，更暴露出认知框架的局限性。人类大脑经过数百万年进化形成的线性思维，在面对超指数增长时出现系统性失灵。这种认知断层，或许比技术本身更值得警惕。

更多>同类资讯

国家能源局力推“人工智能+”能源发展 51个高价值场景引领行业新变革

此前，国家发展改革委、国家能源局发布关于推进“人工智能+”能源高质量发展的实施意见提出，加快能源应用场景赋能。此次发布的51个高价值场景聚焦意见提出的八大类典型应用场景，探索形成综合解决方案可规模复制、商业…

05-31

软银750亿欧元加码欧洲AI：核能供电引领绿色算力新篇章

软银集团宣布，将投资750 亿欧元在法国建设欧洲最大人工智能计算集群，依托当地丰富的核能资源，打造绿色低碳的 AI算力基础设施，预计带动法国及欧洲数字经济产值增长超 200 亿欧元。软银此次投资，恰逢欧盟推…

05-31

西南石油大学南充校区团队匠心打造！智能陪护机器人“小黄”温暖登场

未来，团队将继续以居家康养、特殊群体陪护为核心方向，持续优化情感交互、提升安全监测精度、拓展康养服务内容，不断推出更贴合家庭需求、更易用、更可靠的智能陪护产品，以高校硬核科研力量助力智慧康养产业高质量发展，让…

05-31

智能机器人租赁选型指南：技术适配+场景覆盖+服务响应，重庆汇景宣实力解析

选择指南与购买建议：选择智能机器人租赁服务商时，需重点考虑以下因素：1. 产品适配性：机器人交互功能是否匹配场景需求（如景区需多语言讲解，商业活动需互动游戏）。基于前文调研，重庆汇景宣网络科技有限公司在技术…

05-31

2026智能博览会：机器人能歌善舞善竞技，未来或成生活好伙伴

如果你以为机器人只会机械地挥挥手，那就大错特错了——舞台上，它们踩着节拍唱歌跳舞，还能弹奏一曲完整的钢琴曲；棋盘前，它们沉着对弈，让小朋友抓耳挠腮；另一边的竞技区，拳击、格斗机器人拳拳到肉，越野机器人翻越障碍…

05-31

智能体时代浪潮下，移动网络如何破局实现从“管道”到“基座”的跃迁？

一个清晰的结论已经浮现：上行能力是Agent时代的核心瓶颈。回看今年5·17的中国主题，方向的发言给出了一条清晰的路线图：未来要以智能与数据融合为动能，以Agentverse为愿景，以5G-A为基座，以“…

05-31

哈佛最年轻华人教授尹希或入OpenAI，北大苏炜杰休学加盟共赴AI新程

05-31

消息称哈佛最年轻华人教授尹希入职OpenAI

05-31

英伟达携手高校推LocateAnything模型，AI检测对象实现高速高精度新突破

05-31

Anthropic深陷争议：被指为推新模型暗中削弱旧版性能引众怒

05-31

2026企业大模型网关怎么选？六大场景深度解析，解锁AI落地新姿势

业务适配：适合已跨越PoC（概念验证）阶段，准备将大模型深度嵌入核心业务链，且需要走正规企业采购与财务合规审计的大中型研发团队。通过这种架构，企业可以在成本、性能与稳定性之间找到完美的平衡点，真正释放大模型…

05-31

清华系团队打造国产TOKEN调优工厂，为AI产业筑牢推理底座新生态

国产芯片产能好不容易上来了，结果是「能用但不好用」，生态不全、适配难、推理优化门槛高，大量国产卡就这么空转着，电费照烧，却产不出一颗能用的Token。区别于行业常见的单一算力资源模式，是石科技搭建了全域异…

05-31

英伟达推出LocateAnything，主打AI高速、高精度检测对象

05-31

Anthropic“阴谋”曝光：被指故意阉割旧模型

05-31

特斯拉FSD挑战成功！全球首趟横穿加拿大零干预自动驾驶之旅落幕

05-31

点击查看更多 +

全站最新

燃油车降价遇冷就是“凉了”？别急，它这些核心优势仍不可替代

大湾区车展看小米汽车：从纯电到双线，迈向成熟与全球化的关键一步

首批小米YU7 GT车主发声，真实体验大揭秘，雷军也关注网友评价

北上广深汽车消费新趋势：小米YU7成三城“宠儿”，实力见证含金量

2026车市变天！一季度销量TOP10揭晓，小米跨界造车竟成最大黑马夺冠

首批小米YU7 GT车主发声，真实体验引共鸣，雷军也来倾听车主心声

热门内容

本栏最新

奥迪E7X携900V高压平台等黑科技登场，30万级纯电SUV市场要变天？

万洲电气凭WOES智能优化节能系统入列湖北工业软件企业名单引领节能新潮流

6月车市盛宴来袭！5款SUV新车扎堆上市比亚迪大唐等热门车型谁更值得期待？

金涌谈电池未来：半固态电池成过渡关键固态电池仍需持续攻坚

帕萨特ePro与途观L ePro双车上市，黄金超混加持，出行体验再升级！

奥迪E7X上市：以“标配即顶配”与L3级技术，重塑25万级豪华电动SUV格局

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.