滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Claude Opus 4.7深夜发布，编程能力狂飙

时间：2026-04-18 01:29:44 来源：鞭牛士编辑：快讯 IP：北京 发表评论无障碍通道

AIPress.com.cn报道

Anthropic昨夜扔下了一颗重磅炸弹。Claude Opus 4.7正式上线。

在最关键的软件工程能力上，它完成了对GPT-5.4的超越，甚至在某些指标上逼近了尚未全面开放的Claude Mythos Preview。

01 编程能力暴涨

Opus 4.7在代码领域的表现相当出色。

在权威的SWE-bench Pro基准测试中，Opus 4.7的得分从4.6版本的53.4%直接跳涨至64.3%。

这是什么概念？

GPT-5.4在同一测试中的成绩是57.7%，而Opus 4.7一口气拉开了近7个百分点的差距。

而在SWE-bench Verified的成绩是87.6%，相比4.6的80.8%提升近7个百分点。

这些数据的早期测试用户反馈，以前那些需要工程师盯着看的高难度编程任务，现在可以放心地交给Opus 4.7独立完成。

因为它不仅能处理复杂的长时任务，还会主动验证自己的输出，甚至会在执行前进行「自我纠错」。

Stripe的工程团队在测试中提到：「Opus 4.7能在规划阶段就捕捉到自己的逻辑缺陷，并加速执行。这对需要大规模交付可信金融解决方案的我们来说，可能是游戏规则的改变者。」

02 视觉3倍分辨率

Opus 4.7新版本支持高达2,576像素（长边）的图像输入，分辨率是前代模型的三倍以上，约3.75兆像素。

它可以看清复杂技术图纸上的微小标注，能准确解读化学分子的立体结构，在计算机操作任务中，能从高分辨率截图里识别出细枝末节的UI元素。

在CharXiv视觉推理基准测试中，Opus 4.7的得分从4.6的 69.1% 跃升至 82.1%；配合工具使用时，更是达到了91.0%，相较于前代的84.7%提升巨大。

XBOW，即自主渗透测试平台，的测试数据更为震撼：在视觉敏锐度基准测试中，Opus 4.7得分98.5%，而Opus 4.6仅为54.5%。

「我们最大的痛点一夜之间消失了」，XBOW团队表示。

03 金融、法律、科研等方面也大有提升

别以为Opus 4.7只是个程序员专属模型。在多个专业领域，它都展现出了专家级的素养。

金融领域，它在Finance Agent v1.1测试中取得64.4%的成绩，并在 GDPval-AA，即第三方经济价值知识工作评估测试中创下Claude系列模型的最佳表现。

从财务建模到专业演示文稿制作，Opus 4.7被评价为「比4.6更严谨的金融分析师」。

法律领域，在BigLaw Bench测试中，Opus 4.7在高难度任务下达到 90.9%的准确率。

它能准确区分「转让条款」和「控制权变更条款」，要知道，这可是前沿模型普遍头疼的微妙区别。

科研与多语言，在Graduate-level reasoning测试中，Opus 4.7达到 94.2%，与GPT-5.4 Pro的94.4%和Gemini 3.1 Pro的94.3%处于同一梯队；多语言问答（MMMLU）也提升至91.5%。

04 新版本特性

Opus 4.7在行为模式上有一个有趣的转变：它变得更擅长遵循指令，也更愿意表达专业观点。

一方面，它的指令遵循能力显著增强。

Anthropic特别提示，以前为旧版本编写的提示词可能需要重新调整，因为Opus 4.7会严格按照字面意思执行，而不会像4.6那样宽松解释或跳过部分指令。

另一方面，它在技术讨论中表现出更强的专业素养。

Replit团队注意到：它会在技术讨论中提出反驳，帮助我做更好的决策。感觉真的像一个更好的同事，而不是一个只会说好的的应声虫。

Opus 4.7在文件系统记忆方面也有改进，能在长时间、多会话的工作中记住重要笔记，减少重复上下文的输入。

05 安全、价格与获取方式

安全防护是这次发布的重要一环。

Anthropic表示，Opus 4.7是网络安全风险研究项目框架下的首个模型，其网络攻击能力相比Mythos Preview已被差异化降低。

模型内置了自动检测机制，可阻止高风险的网络安全滥用请求。

当然，合法的漏洞研究、渗透测试和红队测试并不在此列，安全专业人士可申请加入全新的Cyber Verification Program。

价格方面，Opus 4.7维持与4.6相同的定价，输入定价$5/百万token，输出定价$25/百万token。

目前，Claude网页端和App已全面上线，API模型名称为claude-opus-4-7，同时登陆Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry。

但Claude近日要搞AI实名制，国内用户可能体验不到这波更新了。

更多>同类资讯

谷歌I/O前夕Veo 4重磅泄露：AI视频“切镜头”升级，叙事生产力迎变革

05-17

谷歌I/O前夕Veo 4泄露，AI视频迎叙事革命，多机位与音频同步成亮点

05-17

杭州揭牌国家人工智能具身智能中试基地 18家龙头企业携手共探多场景应用

05-17

文生视频先驱智象未来：以认知迭代为翼，探索世界模型新边界

05-17

特斯拉FSD V14.3.3更新：智能召唤提速，核心性能与舒适度双提升

05-17

机械师Mini GTR迷你主机上架预约：R7 8745H+16G+1TB 仅售3999元

05-17

荣耀笔记本X14 2026“战斗版”来袭，酷睿5 320处理器搭配轻薄机身登场

05-17

小米曾规划超轻薄Air旗舰，因体验妥协最终未量产引关注

05-17

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

05-17

买一块三星990 PRO 2TB SSD却收到10块：价值3.3万元

05-17

亚马逊将停止为旧款Kindle提供支持，用户纷纷选择越狱设备

05-17

谷歌Veo 4惨遭泄露，视频版“香蕉”9秒封神

05-17

Meta裁员前夜，员工抢零食如末日

05-17

小米汽车公布YU7全新颜色火山灰

05-17

前Meta员工回忆2022年大裁员：办公室上演免费零食、饮料和充电器哄抢潮

05-17

点击查看更多 +

全站最新

蔚来李斌谈换电：非失血点而是潜力股，未来或成重要收入源

比亚迪闪充站建设提速：一周新增55座，覆盖312城年底将达2万座

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

乐道两年跨越培育期：精准布局纯电赛道，以实力开启跃升新篇

爱跑103号赛级燃油亮相！打破进口依赖，国产高性能燃油填补空白

绿意川蜀邂逅硬核江铃大道成都上市会解锁皮卡多元生活新可能

热门内容

本栏最新

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

小米AI大模型密集落地：从“缺位”到“领跑” 构建人车家全生态新图景

2026年PI与PET胶带行业变革：技术驱动下耐温防静电的供应商新选择

小米YU7“火山灰”配色官图亮相！高纯度灰调设计，5月底将正式发布

科大讯飞AI学习机深度评测：护眼设计搭配学习功能，哪款更适合孩子？

科大讯飞智能办公本深度评测：以科技赋能办公高效体验触手可及

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.