Claude Opus 4.8升级登场：性能提升、功能上新，Mythos模型蓄势待发

时间：2026-05-29 13:07:56 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

Anthropic公司正式推出其旗舰人工智能模型Claude Opus 4.8版本，在性能提升与功能扩展方面带来多项突破。此次更新延续了4.7版本的核心架构，通过算法优化使模型在专业评测中的综合得分稳步提升，同时保持原有定价体系不变。官方强调，新版本在多学科推理、编程任务和系统操作等关键领域展现出显著进步。

在技术性能层面，Opus 4.8在SWE-Bench Pro编程基准测试中取得69.2%的成绩，较前代提升近5个百分点。Humanity's Last Exam多学科推理测试显示，启用工具辅助时模型得分达57.9%，较4.7版本提高13.1%。在OSWorld系统操作测试中，新版本以83.4%的准确率刷新纪录，知识工作基准GDPval-AA更突破1890分历史高位。值得注意的是，金融分析专项测试Finance Agent v2中，模型取得53.9%的得分，展现出处理复杂经济数据的能力。

针对人工智能常见的"幻觉"问题，研发团队重点优化了模型的诚实性表现。通过改进对齐机制，Opus 4.8在任务执行中主动标注不确定信息的频率提升4倍，试图蒙混过关的概率降至前代的四分之一。在错误行为评估中，该模型与尚未公开的Mythos原型模型表现接近，显著优于前代及同期竞品。官方特别强调，这种设计使模型更倾向于维护用户利益，避免提供未经证实的结论。

伴随模型升级，Claude Code开发平台推出革命性的dynamic workflows功能。这项被开发者称为"数字包工头"的新特性，可将复杂任务自动拆解为数百个并行执行的子任务，每个子任务配备独立验证机制。在Bun语言移植项目中，该功能协调75万个代码单元的转换工作，通过持续构建-测试循环确保移植质量，最终在11天内完成99.8%测试通过率的交付。技术文档显示，系统会主动部署对抗性代理检验结论可靠性，直至输出结果收敛。

用户体验方面，网页版新增Effort控制滑块，允许用户手动调节模型思考强度。该功能取代了原有的自适应思维开关，提供低、中、高三级预设选项，默认设置为高强度模式。API接口同步更新Messages规范，支持在对话过程中动态修改系统指令，实现权限控制、预算调整等高级功能而不中断上下文缓存。

在成本控制领域，新版本推出加速计算模式，以2.5倍运行速度提供服务。定价策略显示，该模式每百万token输入费用降至10美元，输出费用50美元，较前代加速服务成本降低三分之二。常规模式维持每百万输入5美元、输出25美元的价格体系，API模型名称更新为claude-opus-4-8，即日起在全平台开放调用。

技术路线图透露，Anthropic正在研发成本更优的模型变体，同时推进顶级模型Mythos的商业化进程。该原型模型在内部测试中已发现超过一万个软件高危漏洞，目前正进行安全护栏的最后调试。公司承诺将在数周内完成技术验证，向企业客户提供Mythos级别的智能服务。

开发文档显示，dynamic workflows功能以研究预览形式上线，覆盖Claude Code的命令行工具、桌面客户端及VS Code插件，面向Max、Team和企业级用户开放。该功能同步集成至Amazon Bedrock、Vertex AI和Microsoft Foundry等主流云平台，管理员可通过权限设置控制功能启用范围。

上海超硅成立了涵盖晶体装备、晶体工艺、加工装备、加工工艺、质量控制、供应链管理等的专门小组，开发了方形硅片的特殊工艺流程，突破了相关技术瓶颈，顺利推出了新一代方形硅片，成功通过了客户验证并大规模量产供应，成为…

再看 NAND 闪存，它单位存储成本更低、单盘容量更大，但存储介质距离主计算芯片更远，数据传输速度更慢，始终无法达到DRAM（HBM）同级别的读写带宽。该方案虽解决了容量与带宽痛点，但人工智能、高性能计…

IT之家 6 月 22日消息，第四届中国国际供应链促进博览会今日在北京正式开幕，优必选在本次大会上正式发布全新一代面向商用服务场景的具身智能人形机器人 Walker C1，覆盖接待导览、商业服务、娱乐互动、…

他深耕数字农业十余年，创立“尘系统”，搭建起融合土壤监测、病虫害防治与区块链溯源的数字农业生态闭环，是国内最早将区块链技术应用于蔬果食品安全溯源的先行者之一。他看到了传统农业对土地“只取不予”的掠夺式伤害，这…

在2026年，企业调用大模型要实现真正的稳定与价值落地，必须掌握以下三个关键策略。2026年，企业将面临高昂的大模型调用成本与业务实时性要求之间的冲突。实操建议：企业应采用“前端轻量化”模式：将高频、低复…

6月22日，视觉内容公司 Getty Images（GETY.US）盘前暴涨近300%，报2.4美元。消息面上，GettyImages宣布与OpenAI达成一项展示合作协议。根据该合作，Getty Ima…

上海瓦奇科技有限公司联合创始人、技术负责人许晓高则重点介绍了AI Agent Infrastructure平台及AI OPC创业生态孵化体系，分享了人工智能技术在产业应用、创新创业和企业成长服务等方面的实践…

本届链博会共吸引676家中外链主企业、专精特新企业和行业机构参展，来自85个国家、地区和国际组织，世界500强及行业龙头企业占比超过65%。人工智能是本届链博会的一大亮点，数智科技链首次设立人工智能专区，…

工作原理：设备通过多轴力传感器、高精度位移传感器、压力分布传感器阵列，对约束型机器人施加标准化的静态力、动态冲击、循环疲劳等载荷，同时实时采集约束力、变形量、响应时间、释放速度等关键安全参数。第二步，安…

极目新闻记者看到，展区内，机器狗、能跳舞敲琴的人形机器人等多款产品集中展示，吸引众多观众和媒体驻足。光谷东智负责人介绍，此次公司展示了“1+1+N”全方位智慧康养服务体系，该套方案以“光子”系列具身智能机器…

白天公共场所人员密集，保洁人员清扫作业容易干扰客流；夜间闭店之后，依靠少数保洁人员大面积清扫，工作强度极大，人工清洁质量参差不齐，漏扫、边角清洁不到位、地面积水打滑，一直都是物业日常管理中的高频痛点。很多商…

近日，南方电网贵州兴义供电局研发的电能表轮换数智识别机器人投入应用，用数字化手段打通长期存在的“数据孤岛”，让数万只电表轮换工作从“人工串联”转向“系统协同”，从“经验判断”转向“数据智能”。南方电网贵州兴…

英伟达正将触角从AI数据中心芯片延伸至人形机器人领域，试图以软件和硬件的组合方案，破解机器人与人类协同作业的核心安全难题。 Velagapudi表示，当前人形机器人的部署重心在于结构化程度较高的仓储与物流场景…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.