滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

Claude Sonnet 4.5强势登场：编程能力再升级，连续30小时自主写代码超厉害

时间：2025-09-30 14:39:35 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

编程模型领域迎来新一轮技术突破——Anthropic推出的Claude Sonnet 4.5模型在多项关键指标上超越前代，成为当前性能最强的编程专用模型。这款新模型不仅在代码生成效率上实现质的飞跃，更在安全性与专业领域应用方面展现出显著优势。

在编程能力验证方面，Claude Sonnet 4.5在SWE-bench测试中取得1.8个百分点的提升，达到行业领先水平。更引人注目的是其持续工作能力——第三方测试显示，该模型可自主完成长达30小时的编程任务，期间生成超过1.1万行代码，成功构建出具备完整功能的类Slack聊天应用。这一表现较前代Opus 4模型的7小时持续工作时长提升超4倍。

计算机系统操作测试（OSWorld）中，新模型以60.2分的成绩刷新纪录，较前代提升近50%。在终端编程（Terminal-Bench）和工具使用（τ2-bench）等专项测试中，同样展现出显著进步。数学能力验证方面，该模型在AIME 2025试题中达到100%准确率（借助Python工具），纯推理模式准确率也高达87%。

专业领域应用成为另一大亮点。在金融、医疗、法律及STEM四大领域，新模型相较前代对基准模型的胜率大幅提升，16K上下文环境下开启深度思考模式时，准确率均突破60%阈值。某金融机构AI负责人评价称，该模型已能提供投资级专业分析，显著提升决策效率。

安全性方面，通过专项训练，模型谄媚、欺骗等不良行为发生率大幅降低。在防御即时注入攻击测试中，新模型展现出更强的鲁棒性，正常请求误拒率从0.15%降至0.02%。GitHub首席产品官Mario Rodriguez特别指出，该模型显著提升了Copilot处理跨代码库复杂任务的能力。

技术生态同步升级，Anthropic发布的Claude Agent SDK将智能体开发框架从专用代码工具扩展为通用开发平台。新框架系统化构建"上下文收集-行动执行-结果验证"开发循环，重点解决长任务内存管理、权限控制系统、多智能体协作三大技术难题。配套推出的Imagine with Claude功能支持实时需求转化，用户输入构思即可自动生成可运行原型。

在商业策略上，新模型延续"提质不提价"原则，输入/输出token价格分别维持3美元和15美元每百万单位。Cognition公司CEO Scott Wu透露，基于该模型开发的Devin工具在规划能力和端到端评估中取得突破性进展。目前开发者已可通过官方渠道体验新模型及开发工具。

更多>同类资讯

1—2月我国电子信息制造业生产出口双增长效益投资齐提速

04-09

90后女生辞职回村创业：牛棚变咖啡店，年营收百万的村咖运营秘籍

04-09

西南交通新突破！内江货运机场或成西部首个专业货运枢纽

04-09

天华新能2026年一季度净利大增，储能动力电池需求成业绩增长强引擎

04-09

东鹏饮料主动降速谋长远，第二增长曲线与海外布局能否破局？

04-09

失去灵魂人物张雪峰，峰学未来“去峰化”之路能否破局前行？

04-09

李佳琦十周年庆典哽咽发言，感恩过往并宣布将暂别直播间两个季度

04-09

国际铜夜盘收涨1.34%

04-09

LME期铜收涨396美元

04-09

以色列：大部分地区正在放宽战时相关规定

04-09

气候变暖下水稻抗病新突破：上海科学家找回丢失基因并构建超级免疫

04-09

二十年磨一剑！中国科学家解锁水稻抗病新基因筑牢粮食安全防线

04-09

自主数据库破局：国产ERP如何以DRP为翼，突围超大型企业数智化转型？

04-09

04-09

04-09

全站最新

油价攀升别慌换电车，普通家庭选车，油车电车咋选才明智？

美股异动丨Meta拉升大涨超9%，推出新AI模型Muse Spark，加码追赶竞争对手

京东JoyStreamer自由态数字人上线：动作灵动镜头跟拍，适配五大行业场景

小米YU7 GT蓄势待发：商标申报中纽北谍照曝光千匹马力或创纪录

江铃集团2026年一季度海外出口大涨69% 新能源与全球化布局齐头并进

热门内容

本栏最新

美股异动丨Meta拉升大涨超9%，推出新AI模型Muse Spark，加码追赶竞争对手

公告精选︱中科蓝讯：2025年净利润同比增长371.66% 拟10送4.8派20元；通鼎互联：用于数据中心的光纤产品比重较小

A股异动丨今日起"戴帽"，ST恒信20cm跌停，创2013年7月以来新低

无人机动力测试台怎么选？Tyto Robotics固态设计优势显著实力出圈

国际油价短线下挫美油大跌18%

美元指数基本回吐今年以来全部涨幅停火提振风险情绪

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.