滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

编程与智能体开发新突破：Claude Sonnet 4.5携多项升级登场

时间：2025-10-01 04:03:20 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域迎来重要进展，Anthropic公司正式推出新一代AI模型Claude Sonnet 4.5。该模型在编程能力、计算机操作效率等关键指标上表现突出，特别是在处理复杂多步骤任务时展现出持续专注能力，可连续工作超过30小时。

在编程能力评测中，Claude Sonnet 4.5在SWE-bench Verified测试中位居榜首，其真实编程表现获得专业认可。计算机操作能力评估方面，该模型在OSWorld基准测试中取得61.4%的得分率，较四个月前的版本提升近20个百分点。实际演示显示，模型可直接在浏览器环境中完成网站导航、表单填写等全流程自动化操作。

定价策略方面，新模型保持与前代相同的收费标准：每百万输入token收费3美元（约21.4元人民币），输出token收费15美元（约106.8元人民币）。这一稳定的价格体系为开发者提供了可预期的成本控制。

开发工具链迎来重大升级。Claude Code新增检查点功能，支持自动保存工作进度和即时回滚操作。用户通过双击Esc键或输入/rewind命令，即可快速恢复至历史版本。该功能特别适用于复杂代码修改场景，可单独恢复代码、对话记录或两者组合。

终端界面优化带来更好的可视化体验，新增可搜索的指令历史功能。原生VS Code扩展插件的推出，使开发者能在集成开发环境中直接调用Claude Code，通过专属侧边栏和行内差异对比功能，实时监控代码变更过程。

针对企业级开发需求，Claude Agent SDK（原Claude Code SDK）正式开放。该工具包提供核心架构支持，包含情境管理系统和权限框架，新增子智能体与钩子函数支持。开发者可基于这些组件构建定制化智能体流程，适配特定业务场景。

情境管理能力实现突破性进展。新推出的情境编辑功能可自动清理过期工具调用记录，在保持对话连贯性的同时优化token使用效率。记忆工具则构建了基于文件的外部存储系统，允许智能体在多次对话间持续积累知识库，支持跨会话状态维护。

性能测试数据显示，情境管理与记忆工具的协同使用可使复杂任务处理效率提升39%，token消耗降低84%。在100轮网络搜索测试中，情境编辑功能成功完成原本因情境耗尽而失败的任务，展现出显著的技术优势。

专业领域评估证实，新模型在法律、金融、医学等垂直领域的知识掌握和推理能力均有显著提升。安全训练的强化使模型行为模式得到改善，有效减少了谄媚、欺骗等不良倾向。自动化行为审计显示，其总体行为失当评分较前代明显降低。

更多>同类资讯

黑蚁资本张沛元：消费企业全球化浪潮已至，探索多元路径与未来趋势

06-24

豆包日均Token调用量飙升，梁汝波透露字节AI战略新动向

06-24

叮咚买菜切配菜业务爆发增长，2026年预计增幅超85%引领生鲜新潮流

06-24

大搜车赴美IPO：从“美国模式”翻车到“中国模式”逆袭资本路

06-24

阿里推进业务聚焦或出售灵犀互娱，游戏业务版图收缩，交易估值最高达90亿

06-24

上海8大商场借宝可梦“破局”：以IP为钥，解锁线下商业新体验密码

06-24

AI人才争夺白热化：Token成本激增下，小公司如何突围觅贤才？

06-24

马云带阿里高管体验插秧，合伙人制度下他仍是阿里权力核心？

06-24

影石向大疆腹地冲锋：专利战、价格战下的全面攻防与行业变局

06-24

AI推理赛道再掀热潮！Baseten获101亿融资，估值飙升至880亿

Baseten帮助企业客户部署和运行开源或自主定制的AI模型，提供GPU调度、自动扩缩容、可观测性和计费等全套系统软件，相当于AI推理阶段的基础设施层。推动这一增长的核心逻辑是，开源AI模型的性能正在逼近闭源…

06-24

字节跳动豆包Seed 2.1系列模型上线，Pro与Turbo版助力Coding与Agent新发展

doubao-seed-2-1-pro-260628 是一个深度思考模型，官方宣称是面向 Coding 与 Agent时代打造的新一代旗舰模型，在 Coding 工程交付、Agent 长链路任务执行与多…

06-24

亚马逊云科技储瑞松：模型能力与工程体系共促Agentic AI爆发拐点到来

这背后，是模型能力的不断提升和Agentic工程体系的日益成熟，两者形成了一个相互促进的飞轮。储瑞松表示，Agentic工程体系是把模型能力转化为可以稳定交付业务结果的智能体的体系化的工程能力。最后，储瑞…

06-24

雷军就小米YU7“深海蓝”绝版表态：若呼声高或考虑重新推出

06-24

华为乾崑智驾调整售价权益，新增无忧保障正式为高阶智驾“兜底”

06-24

Seedance 2.5七月登场：30秒直出视频，支持50个全模态参考素材

06-24

点击查看更多 +

全站最新

小米SU7与尚界Z7高速续航实测：CLTC相近为何续航差近百公里？

问界全系车型闪耀链博会，以“五高”标准引领中国豪华汽车向上之路

马云率阿里高管下田插秧：以“种地”之姿，All in AI 谋长远发展

2026快手珠宝文玩配饰行业洞察：流量攀升，消费增长，细分赛道亮点纷呈

电商运营全攻略：深度剖析小红书、快手、抖音、微博四大平台玩法

零跑D99提档6月25日上市！大尺寸高配置，或成MPV市场新变量

热门内容

本栏最新

小米SU7与尚界Z7高速续航实测：CLTC相近为何续航差近百公里？

马云率阿里高管下田插秧：以“种地”之姿，All in AI 谋长远发展

2026快手珠宝文玩配饰行业洞察：流量攀升，消费增长，细分赛道亮点纷呈

电商运营全攻略：深度剖析小红书、快手、抖音、微博四大平台玩法

理想L8“六改五”焕新登场！售价亲民，目标直指迈巴赫宝马水准

赛力斯康波：AI引领汽车智能化下半场，驱动产业创新与可持续发展

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.