在科技界的瞩目之下,美国大模型领域的独角兽企业Anthropic于近日在其首届开发者大会上,震撼发布了Claude模型的最新版本:Claude Opus 4与Claude Sonnet 4。此次更新标志着Claude系列自2024年6月以来迎来的首次大版本迭代,为人工智能领域注入了新的活力。
Anthropic将Claude Opus 4誉为“编程领域的巅峰之作”,该模型在复杂、耗时长的任务及智能体工作流中展现出了卓越的稳定性。而Claude Sonnet 4作为Claude Sonnet 3.7的重大升级,以编程与推理能力为核心,同时能更精确地理解并响应用户提示词。这两款模型均为混合模型,提供了即时回复与用于深度推理的扩展思考(extended thinking)两种模式。
在权威的编程基准测试SWE-bench Verified上,开启扩展思考的Claude Opus 4与Claude Sonnet 4分别以79.4%和80.2%的得分,显著超越了OpenAI Codex-1、OpenAI o3、OpenAI GPT-4.1及Gemini 2.5 Pro等竞争对手。在编程、工具使用、视觉推理及数学等领域的基准测试中,这两款模型同样表现出色,超越了OpenAI o3。而在多语言问答及研究生级别推理任务上,Claude Opus 4与OpenAI o3得分相当。
新模型的智能体能力也得到了显著提升,最高可独立运行7小时,并引入了文件API、提示词缓存等创新功能。这些升级使得Claude系列模型在处理复杂任务时更加高效与智能。
值得注意的是,Pro、Max、Team和Enterprise级别的Claude订阅用户将能够使用这两款新模型及其扩展思考模式,而Sonnet 4则向免费用户开放。用户可在Anthropic API、Amazon Bedrock及Google Cloud的Vertex AI上调用这些模型,定价与之前的Opus和Sonnet模型保持一致。
Anthropic还同期推出了AI编程助手Claude Code,该助手接入了Claude Opus 4模型,能够实时映射并解释百万行级别的代码库。Claude Code与GitHub、GitLab、VS Code、JetBrains IDE及命令行工具深度集成,可直接嵌入至开发终端中,为开发者提供了前所未有的便捷与高效。
在Code with Claude开发者大会上,Anthropic创始人Dario Amodei开场便直接揭晓了Claude 4系列模型的发布,给与会者带来了巨大惊喜。Amodei表示,虽然Anthropic已有一段时间未更新Opus模型,但Opus始终被定位为旗下最强大、最智能的模型,而Sonnet则是用户过去一年来广泛使用的中等水平模型。尽管Claude Opus 4在部分基准测试上的成绩并未明显高于Claude Sonnet 4,但Amodei强调,对于如此大型的模型而言,基准测试并不能全面反映其能力。
Anthropic首席产品官、Instagram联合创始人Mike Krieger进一步分享了Claude 4系列模型的详细信息。Krieger指出,Claude Opus 4在理解代码库、规划添加内容以及处理复杂智能体工作流方面表现出色,而Claude Sonnet 4则在日常编码任务、应用程序开发及配对编程方面大放异彩。Claude 4系列模型还升级了关键功能,使其能够并行处理多种工具,并在会话之间保持记忆,随着时间的推移不断积累知识。
Krieger还分享了他在加入Anthropic后不久,凭借Claude的帮助,仅用3人团队便成功打造亚马逊Alexa语音助手原型的经历。这次合作不仅让Claude成为Alexa Plus的核心模型之一,也让Krieger更加坚信AI协作的潜力。如今,AI已不仅是工具,而是真正的智能协作伙伴,持续推动技术边界的拓展。