Anthropic公司于近日正式揭晓了其最新的技术成果——Claude Opus 4.1模型。这一版本相较于今年5月推出的Claude 4系列,在编码、推理和执行指令方面实现了显著提升。
据Anthropic官方介绍,Claude Opus 4.1在SWE-bench Verified评估中的软件工程准确性达到了74.5%,相较于Claude Sonnet 3.7的62.3%和Claude Opus 4的72.5%,进步显著。新模型在深度研究、数据分析,特别是细节追踪和代理搜索方面的能力尤为突出。
相较于Opus 4,Opus 4.1在多项功能上均有所提升,特别是在多文件代码重构方面的表现令人瞩目。Rakuten Group的测试显示,Opus 4.1能够精准定位大型代码库中的错误并进行修正,而不会进行不必要的调整或引入新错误。
Windsurf的基准测试报告指出,Opus 4.1在初级开发者测试中的表现相较于Opus 4有了显著提升,这一性能飞跃与从Sonnet 3.7到Sonnet 4的升级相当。
即日起,Claude Opus 4.1模型正式向Claude客户开放。用户可以通过Claude Code、Anthropic的API、亚马逊Bedrock以及谷歌云的Vertex AI平台使用该模型。
值得注意的是,Anthropic还在社交媒体上透露,未来几周内将发布对模型的重大改进,这无疑让业界对Claude系列模型的后续升级充满期待。与此同时,OpenAI也预计将在本周内发布新动态。