ITBear旗下自媒体矩阵:

Claude Mythos漏洞神话破灭?华尔街恐慌背后是AI“泡沫”争议

   时间:2026-04-12 22:04:54 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

华尔街的会议室里气氛凝重,金融监管机构连夜召集各大银行高层。这场紧急会议的焦点,是尚未正式亮相的AI模型Claude Mythos——据称其具备自主挖掘海量0day漏洞的能力,足以引发系统性网络攻击风暴。然而随着更多细节浮出水面,这场被渲染成"AI奥本海默时刻"的危机,正逐渐显露出人为夸大的痕迹。

技术团队对Mythos宣称的"重大突破"进行复核时发现,其报告的数千个漏洞中,超过七成存在于早已停止维护的旧版软件。更令人质疑的是,所谓"高危0day漏洞"的判定依据,仅来自198次人工复核样本。安全研究员指出,这种基于极小样本的数据外推法,在学术界和安全领域都缺乏可信度。

开源社区的测试结果进一步动摇了Mythos的神话。AISLE实验室使用参数仅36亿的GPT-OSS-20b模型,成功识别出FreeBSD系统中的旗舰级漏洞。而具备51亿参数的模型,则复现了潜伏27年的OpenBSD漏洞分析逻辑。这些开源模型的调用成本低至每百万Token 0.11美元,与闭源大模型形成鲜明对比。

在虚假漏洞识别测试中,小模型展现出惊人优势。面对伪装成SQL注入的Java代码,DeepSeek R1等开源模型精准追踪数据流并识破伪装,而GPT-5.4和Claude Sonnet 4.5等顶尖闭源模型却集体误判。这种反转现象印证了网络安全领域的核心结论:不存在永远领先的单体模型,能力分布呈现明显的锯齿状特征。

传奇黑客George Hotz公开质疑这场安全恐慌的合理性。这位破解过iPhone和PlayStation 3的安全专家指出,当前零日漏洞稀缺的根本原因是法律限制,而非技术难度。"如果每天发布一个漏洞直到新模型问世,就能让这些公司停止渲染末日论调。"他在社交媒体上的尖锐批评引发广泛共鸣。

性能评估数据同样充满争议。虽然Claude Mythos在Epoch能力指数上超越前代Opus 4.6,但与GPT-5.4的差距不足5%。气候投资人Ramez Naam分析指出,Mythos的进步属于线性迭代范畴,并未出现预期中的能力跃迁。更蹊跷的是,Anthropic内部报告与公开ECI数据存在显著差异,暗示其评分体系存在不确定性。

用户端的反馈则暴露出另一个维度的问题。大量使用者抱怨最新版Opus 4.6出现"降智"现象,在洗车方案等基础任务中表现不如前代。AMD主管的日志分析显示,Claude的中位思考长度从2200字符骤降至600字符,深度推理能力被明显压缩。为应对80倍增长的API请求,用户不得不重复调用,导致使用成本飙升。

资深订阅用户的长文控诉揭开了更多内幕。Anthropic被指在核心模型尚未稳定时,将算力资源倾斜至开发"/buddy"等娱乐功能。收紧的Token使用限制与强制降级策略,暴露出其深陷算力困局的现实。这种"舍本逐末"的产品路线,与渲染超级AI威胁的营销策略形成荒诞对照。

当实验室里的末日预言遭遇开源社区的实证检验,当用户抱怨模型变笨与渲染的超级智能形成反差,这场由AI公司主导的安全恐慌正演变为行业信任危机。技术真相与营销话术的激烈碰撞,折射出人工智能领域亟待规范的竞争乱象。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version