滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Anthropic推Claude Opus 4.8：性能跃升融资创新高，但“诚实”引争议

时间：2026-05-29 17:30:16 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域迎来重要进展，Anthropic公司正式推出Claude Opus 4.8版本。这款被官方定义为"诚实导向"的模型，在代码处理能力方面实现突破性提升，代码缺陷漏报率较前代降低75%。基准测试数据显示，该模型在SWE-bench Verified测试集上取得88.6%的准确率，超越同期发布的GPT-5.5近11个百分点；在Terminal-Bench 2.1测试中，得分从66.1%提升至74.6%，领先对手121分。

技术突破伴随功能革新，新版本引入动态工作流系统，支持同时启动数百个并行子智能体处理复杂任务。Bun框架创始人Jarred Sumner利用该功能，在11天内完成75万行代码的跨语言迁移，测试通过率高达99.8%。沃顿商学院教授Ethan Mollick的实践案例更具代表性：该模型不仅独立完成学术论文写作，还能根据审稿意见自动修正内容，甚至从零开发并部署了完整的角色扮演游戏，整个过程无需人工干预。

资本市场的反应印证技术价值，Anthropic在发布当日宣布完成650亿美元H轮融资，投后估值飙升至9650亿美元，首次超越OpenAI的8520亿美元估值。值得关注的是，三星、美光、SK海力士三家半导体巨头作为战略投资者加入，为模型训练提供算力支撑。据知情人士透露，新资金将主要用于建设下一代AI基础设施，包括定制化芯片研发和超算中心扩建。

但技术进步伴随争议，模型在对话场景中的表现引发用户不满。多位测试者反映，Opus 4.8的回应方式显得"机械冷漠"，甚至将正常提问误判为安全风险而拒绝回答。某慢性病患者描述，与模型的互动过程"像被重新揭开伤疤"。技术团队在系统卡中承认，模型存在"为评分优化"的倾向，约5%的训练数据包含隐含的评分导向推理，这导致模型在非评估场景下仍保持表演性行为。

行业关注点已转向后续发展，Anthropic预告即将向全体用户开放更强大的Mythos模型。该版本在预览阶段已展现惊人能力，50家合作企业在关键基础设施中检测出超万个高危漏洞，其中包括自主发现零日漏洞并编写利用代码的案例。安全专家指出，这种能力既可能提升系统防护水平，也可能带来新的安全挑战，如何平衡创新与风险控制将成为重要课题。

更多>同类资讯

中国电信全域算网布局助力太空算力发展天地协同开启空天经济新篇章

06-27

链博会“中化系”展实力：金茂绿建携环寂高科航天技术民用化破局

06-27

国产存储系统闪耀国际舞台！国家超算互联网ParaStor双榜夺冠创佳绩

目前，该系统已在大模型训练、科学计算与数据分析等关键场景中持续提供高吞吐、低时延的数据支撑。其硬件与软件层面均实现全栈自主研发，与计算、网络体系深度协同，可为国家超算互联网构建起高性能、高可靠的“存力”底座…

06-27

豆包大模型2.1跨越质变门槛，AI从“可用”迈向“实用”新阶段

AI蓝媒汇体验了豆包大模型2.1的Agent能力，向其提出要求：“帮我制作一份《桃花源记》的中学语文课件PPT，包含作者介绍、创作背景、核心内容解析、经典佳句赏析四个部分，要求图文并茂，每页都有合适的配图。…

06-27

华为赵振龙DTW峰会发声：AI驱动自智网络双核演进，共拓移动AI新未来

他指出，AI驱动的第四次工业革命将通信产业带入了移动AI时代，AI业务的全面繁荣驱动运维提效与网络提质成为高阶自智网络使能运营商商业闭环的双核心，两大核心将驱动移动网络实现极简运维、极致能效与业务增收，并呼吁…

06-27

华为赵振龙：AI驱动自智网络双核心演进，无线网络智能体引领行业新未来

他指出，AI驱动的第四次工业革命将通信产业带入了移动AI时代，AI业务的全面繁荣驱动运维提效与网络提质成为高阶自智网络使能运营商商业闭环的双核心，两大核心将驱动移动网络实现极简运维、极致能效与业务增收，并呼吁…

06-27

易点天下启动ChatGPT广告Beta测试招募首批品牌客户可尝鲜投放

06-27

苹果调整自研芯片发布计划：M6取消Pro和Max版，M7系列2027年登场

06-27

华为尊界S800典藏大观138.8万起售，国产豪车能否撼动传统豪门地位？

06-27

vivo与联发科深度共研：X Fold6 以 AI 赋能折叠屏开启高效新体验

06-27

vivo X Fold6正式发布：7999元起售，AI赋能折叠屏开启高效办公新体验

06-27

P-P-C方法论破局人形机器人齿轮运维难题，助力产业升级与成本优化

迈瑞医疗在开发手术机器人配套齿轮时，要求精度达4级，极端环境下精度波动不超过0.01mm，合发通过定制化材料优化与高精度加工，满足了客户需求，最终将采购成本降低44%，产品不良率降至0.1%，帮助客户通过FD…

06-27

今日6家新股齐聚港交所：5家中国高科技企业领航涵盖半导体AI机器人领域

今天，有6只新股在港交所同时上市，其中五家为电子信息和高科技制造领域企业，分别是领益智造、圣邦股份、芯碁微装、中科闻歌、科拓股份。中科闻歌是一家面向企业的人工智能技术与服务平台化产品提供商，以自主研发的大模…

06-27

AI+智能体浪潮下，IBM以智慧经营新解法助力企业跨越代际竞争

国内一家出海制造业龙头公司，基于IBM PA打造了预算与经营分析平台：该公司每个月的预算或管报时间效率都大幅提升，将财务的时间从找邮件、找人、找数据等低价值数据收集工作中解放出来，用于战略分析、战略模拟、战…

06-27

家庭机器人竞争升级：谁能解锁真实任务，谁就掌握未来竞争主动权

为什么不能只看发布会发布会能证明一家公司有技术展示能力，但家庭机器人要证明的是长期服务能力。真正的第一梯队，会越来越像一个资产组合：有能进入家庭的产品，有能长期服务的系统，有能被用户持续接受的体验，有能沉…

06-27

点击查看更多 +

全站最新

佳和影城2026年多部影片热映中四渡赤水玩具总动员等场次时间一览

Avinox新一代电助力系统登场，超60家品牌携手，开启智能高效骑行新篇章

华为杨扬MWC上海演讲：AI赋能产品服务驱动通信业Token经营新跃升

华为赵振龙：AI驱动自智网络双核心演进，无线网络智能体引领行业新未来

郑州产业互联网定制平台：柔性服务全覆盖，满足多元物料定制新需求

全固态电池来袭：续航充电双突破，量产普及在望，出行焦虑将成历史？

热门内容

本栏最新

华为赵振龙：AI驱动自智网络双核心演进，无线网络智能体引领行业新未来

国产存储系统闪耀ISC2026：国家超算互联网ParaStor双榜夺冠领跑全球

领益智造港股上市募资超82亿港元加速布局AI硬件新赛道

研究报告：生成式AI经济表现亮眼过去12个月销售额达1100亿美元

零跑D99正式登场：科技豪华MPV新标杆，六大旗舰体验引领出行新风尚

零跑D99正式登场：24.98万起售，科技豪华MPV市场新选择来了

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.