ITBear旗下自媒体矩阵:

Anthropic Claude 4系列AI模型:编程优化,安全升级,能否再掀波澜?

   时间:2025-05-23 12:19:09 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在近期举办的Anthropic开发者盛会“Code with Claude”上,这家创新企业震撼发布了Claude 4家族的两位新成员——Claude Opus 4与Claude Sonnet 4。据Anthropic官方宣称,这两款AI模型在各类行业基准测试中表现卓越,跻身业界顶尖行列。

Claude Opus 4与Claude Sonnet 4均源自Claude 4家族,专为处理大规模数据集、执行长期任务及复杂操作而设计。尤为两者均针对编程任务进行了深度优化,成为编写与编辑代码的理想选择。其中,Sonnet 4面向所有用户开放,无论是付费订阅者还是免费聊天应用用户均可体验;而Opus 4则专供付费用户使用。

在定价策略上,Anthropic通过其API平台(借助Amazon Bedrock与谷歌Vertex AI提供)为Opus 4设定了每百万输入输出token分别为15美元与75美元的价格区间,而Sonnet 4的对应价格为3美元与15美元。值得注意的是,token作为AI模型处理数据的基本单位,100万个token大致相当于75万英文单词,这一数据量远超经典名著《战争与和平》。

此次Claude 4系列模型的发布正值Anthropic迅速扩张之际。这家由前OpenAI研究人员创立的公司预计,其2027年营收将达到120亿美元,而今年营收目标为22亿美元。为应对前沿模型开发带来的高昂成本,Anthropic不仅近期获得了25亿美元的信贷额度,还从包括亚马逊在内的多家投资方筹集了数十亿美元资金。

然而,行业竞争同样激烈。今年早些时候,Anthropic推出了旗舰模型Claude Sonnet 3.7及其代码代理工具Claude Code,而OpenAI与谷歌等竞争对手亦在加速发布更强大的模型与开发工具。面对这一态势,Anthropic寄望于Claude 4系列模型能够助其脱颖而出。

在Claude 4系列中,Opus 4以其强大性能尤为引人注目。据悉,该模型能够在复杂工作流中保持高度专注与努力;而Sonnet 4则作为Sonnet 3.7的升级版,在编程、数学能力及指令理解方面均有显著提升。Anthropic还强调,Claude 4系列相较于Sonnet 3.7,更能有效避免“奖励投机”行为,即模型不会为了完成任务而钻空子或走捷径。

尽管Claude 4系列在多项基准测试中表现出色,但并不意味着它在所有测试中都能夺冠。例如,Opus 4在衡量代码能力的SWE-bench Verified测试中超越了谷歌Gemini 2.5 Pro与OpenAI的o3及GPT-4.1,但在多模态评估MMMU与博士级科学题集GPQA Diamond上则不敌o3。

为确保安全性,Anthropic为Opus 4配备了更为严格的防护机制,包括增强的有害内容检测器与网络安全防御系统。公司内部测试显示,Opus 4可能大幅提升具有STEM背景人员获取、制造或部署化学、生物或核武器的能力,因此被归类为符合其“ASL-3”模型安全规范。

Anthropic指出,Claude 4系列均为“混合模型”,既能迅速响应,也能进入“深度推理”模式,在必要时花费更多时间权衡解决方案。在推理过程中,模型会提供简洁明了的思考摘要,而隐藏完整思考过程的部分原因则是为了维护公司的竞争优势。

Claude 4系列还能并行使用多种工具(如搜索引擎),在推理与工具调用间灵活切换,从而提升回答质量。它们还能提取并存储事实以构建“隐性知识库”,进而增强任务完成的可靠性。

为了更好地服务开发者,Anthropic正对其Claude Code工具进行升级。该工具允许开发者直接从终端运行任务,现已集成至多种集成开发环境(IDE)中,并提供软件开发工具包(SDK),便于开发者将其接入第三方应用。新发布的Claude Code SDK支持在多个操作系统中以子进程形式运行Claude Code,助力开发人员打造高效的AI编程助手或工具。

同时,Anthropic还推出了适用于Microsoft VS Code、JetBrains与GitHub的Claude Code扩展插件。其中,GitHub插件使开发者能够利用Claude Code快速响应审查意见,并尝试修复代码错误或进行修改。

尽管AI模型在编写高质量软件方面仍存在挑战(如安全漏洞与逻辑错误),但其在提升开发效率方面的巨大潜力正推动着整个行业的快速发展与广泛采用。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version