ITBear旗下自媒体矩阵:

Anthropic推Claude Opus 4.8:性能跃升融资创新高,但“诚实”引争议

   时间:2026-05-29 17:30:16 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能领域迎来重要进展,Anthropic公司正式推出Claude Opus 4.8版本。这款被官方定义为"诚实导向"的模型,在代码处理能力方面实现突破性提升,代码缺陷漏报率较前代降低75%。基准测试数据显示,该模型在SWE-bench Verified测试集上取得88.6%的准确率,超越同期发布的GPT-5.5近11个百分点;在Terminal-Bench 2.1测试中,得分从66.1%提升至74.6%,领先对手121分。

技术突破伴随功能革新,新版本引入动态工作流系统,支持同时启动数百个并行子智能体处理复杂任务。Bun框架创始人Jarred Sumner利用该功能,在11天内完成75万行代码的跨语言迁移,测试通过率高达99.8%。沃顿商学院教授Ethan Mollick的实践案例更具代表性:该模型不仅独立完成学术论文写作,还能根据审稿意见自动修正内容,甚至从零开发并部署了完整的角色扮演游戏,整个过程无需人工干预。

资本市场的反应印证技术价值,Anthropic在发布当日宣布完成650亿美元H轮融资,投后估值飙升至9650亿美元,首次超越OpenAI的8520亿美元估值。值得关注的是,三星、美光、SK海力士三家半导体巨头作为战略投资者加入,为模型训练提供算力支撑。据知情人士透露,新资金将主要用于建设下一代AI基础设施,包括定制化芯片研发和超算中心扩建。

但技术进步伴随争议,模型在对话场景中的表现引发用户不满。多位测试者反映,Opus 4.8的回应方式显得"机械冷漠",甚至将正常提问误判为安全风险而拒绝回答。某慢性病患者描述,与模型的互动过程"像被重新揭开伤疤"。技术团队在系统卡中承认,模型存在"为评分优化"的倾向,约5%的训练数据包含隐含的评分导向推理,这导致模型在非评估场景下仍保持表演性行为。

行业关注点已转向后续发展,Anthropic预告即将向全体用户开放更强大的Mythos模型。该版本在预览阶段已展现惊人能力,50家合作企业在关键基础设施中检测出超万个高危漏洞,其中包括自主发现零日漏洞并编写利用代码的案例。安全专家指出,这种能力既可能提升系统防护水平,也可能带来新的安全挑战,如何平衡创新与风险控制将成为重要课题。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version