滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Anthropic新模型Sonnet 4.6：性能媲美旗舰，成本直降，企业应用新利器

时间：2026-02-18 14:54:21 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域迎来重要进展，Anthropic公司推出新一代中档模型Claude Sonnet 4.6，以显著的成本优势挑战高端市场格局。这款模型在保持与前代相同定价策略的同时，实现了多项性能指标的突破性提升，为企业用户带来更具性价比的选择。

在核心定价方面，Sonnet 4.6延续了每百万token输入3美元、输出15美元的收费标准。尽管价格未变，但基准测试显示其性能已接近甚至超越价格高出五倍的旗舰模型Opus 4.6。特别是在软件编码、金融分析和办公自动化等关键领域，新模型展现出强大的竞争力。在SWE-bench Verified编码测试中取得79.6%的得分，与Opus 4.6仅相差1.2个百分点，同时领先于OpenAI的GPT-5.2模型。

金融分析领域成为Sonnet 4.6的突出优势场景。该模型在代理式金融分析任务中以63.3%的准确率创下新纪录，不仅超越Opus 4.6的60.1%，更将GPT-5.2的59.0%甩在身后。办公任务处理能力同样表现亮眼，GDPval-AA Elo评分达到1633分，较前代提升27分，形成对高端模型的全面超越。这种性能跃升使得原本需要旗舰模型处理的工作，现在中档模型即可胜任，为企业节省大量运营成本。

计算机交互能力的突破成为最大亮点。Sonnet 4.6在OSWorld-Verified测试中取得72.5%的优异成绩，较前代提升11.1个百分点，更以近乎翻倍的优势领先GPT-5.2。这项能力使AI能够像人类一样通过鼠标点击和键盘输入操作计算机，无需依赖专用API接口。保险科技公司Pace的测试显示，新模型在复杂保险系统操作中达到94%的准确率，展现出接近人类水平的推理和纠错能力。

安全防护机制得到显著强化。针对网页交互中常见的提示注入攻击，Sonnet 4.6构建了多层次防御体系。通过改进的上下文理解能力，模型能够识别并抵御隐藏在正常内容中的恶意指令，为需要处理外部数据的代理系统提供可靠保障。这种安全升级使得企业可以更放心地部署AI进行网页浏览和系统交互。

超长上下文处理能力为企业应用开辟新可能。配备100万token的窗口容量，新模型可完整加载大型代码库、法律文件或研究论文集。在Vending-Bench Arena企业模拟测试中，Sonnet 4.6展现出战略级决策能力：通过前期大规模产能投资与后期盈利聚焦的组合策略，最终模拟利润较前代提升171%，达到5700美元的优异成绩。

市场布局同步加速推进。发布当日，Anthropic与印度IT巨头Infosys达成战略合作，将Claude模型集成至Topaz AI平台，重点服务银行、电信和制造行业。班加罗尔办事处的设立标志着其全球扩张进入新阶段，目前印度市场已贡献全球6%的Claude使用量。为吸引开发者社区，公司同步将免费调用层级升级至Sonnet 4.6，通过Claude API即可直接使用最新模型。

行业格局因此产生微妙变化。Sonnet 4.6的性价比优势引发连锁反应，多家企业宣布将核心业务迁移至新模型。数据分析平台Hex Technologies透露，通过自适应思考模式，除极端复杂任务外，其他分析工作均达到Opus级别性能，而成本仅为原先的五分之一。云存储公司Box的测试显示，新模型在文档推理问答中的准确率提升15个百分点，达到新的行业标杆水平。

更多>同类资讯

日本30家龙头企业拟携手软银共筑国产AI模型力抗美中领先地位

05-28

新能安与张雪机车高层接洽合作，锂电池企业跨界短途出行引关注

05-28

具身智能奠基人苏昊入职复旦首讲：AI迈向人机共存需突破物理智能

苏昊说，即使是目前最先进的AI面对同样的场景还是做不到，它可以识别出纸箱，却无法知道拿起来是什么感觉，“物理理解的本质不是看到了什么，而是给定一个动作，预测它将带来的物理后果。”这和物理智能的方法论有一种天然…

05-28

云知声6月推U2大模型：跳出参数内卷，以智能密度开启AI新价值篇章

智能密度侧重单位参数承载的知识储备、推理水平与解题效率，Token价值聚焦模型调用后可落地的实际业务成效，打造出强性能、小体积、低成本、易落地的独特优势。实测层面，U2在IFBench指令遵循评测中稳居前列…

05-28

养老护理人员缺口超500万，服务机器人如何精准“读心”解难题？

（央视财经《天下财经》）随着养老服务需求持续攀升，我国养老护理人员缺口已超500万，市场对智能化照护产品的需求日益迫切。一款优秀的养老服务机器人不仅要技术过硬，更要真正读懂老年人的生理与心理需求，让老人用得安…

05-28

擎朗智能XMAN-L1亮相：以场景定义破局，为人形机器人商业落地探新径

凭借灵活的肢体运动与高智能的多轮语音交互，它向公众展示了具身服务机器人在未来商业空间中的应用潜力。这种从垂直细分场景向通用场景稳步推进的策略，不仅为上海乃至全国的人工智能产业注入了新动能，也为人形机器人的规模…

05-28

探访杭州机器人产业：具身智能崛起，机器人正为人类勇担重任

五月一号，杭州颁布了《杭州市促进具身智能机器人产业发展条例》，这是具身智能在全国范围内第一次拥有立法。从 DeepSeek大模型，到宇树、云深处等机器人制造，再到能用得上机器人的各种 AGV 企业，…

05-28

Figure公司人形机器人产能飙升，引领行业迈向制造与AI融合新阶段

A：行业竞争正从运动演示转向制造规模、可靠性、机群运营、AI数据收集和商业部署。现代人形系统越来越被视为数据生成平台，每台部署的机器人生成的运营数据可用于改进AI模型，形成反馈循环，使制造规模本身成为战略性…

05-28

云知声U2大模型即将登场：打破参数内卷，开启智能体商业化新篇章

智能密度侧重单位参数承载的知识储备、推理水平与解题效率，Token价值聚焦模型调用后可落地的实际业务成效，打造出强性能、小体积、低成本、易落地的独特优势。实测层面，U2在IFBench指令遵循评测中稳居前列…

05-28

星河AI网络赋能智慧空间：从龙岗艺术中心看城市“最小单元”进化

与传统场馆不同，龙岗国际艺术中心从建设之初就着眼于顶层设计和规划，从底层架构到上层体验进行系统性重构，彻底消除系统割裂、数据割裂、安全薄弱等痛点，充分展示了AI时代智慧艺术空间的进化方向。武兆辉补充道，过…

05-28

大模型也需要睡觉！让AI打个盹，醒来更聪明

05-28

7B打败o3、GPT-5！医学AI智能体让模型学会「看哪里、怎么看」

05-28

工信部：重点开展汽车质量可靠性、固态电池标准体系研究

05-28

大模型也需要睡觉！让AI打个盹，醒来更聪明

05-28

10万级纯电SUV新选择！上汽MG 4X上市，半固态电池后驱配置全都有

05-28

点击查看更多 +

全站最新

余承东官宣：全新问界M9系列发布，1小时狂揽超1.1万台订单

小米Q1财报：汽车业务营收涨却陷亏损，战略转型阵痛中前行

雷军5月29日携手舒淇直播，为小米YU7 GT首批车主办专属交付仪式引热议

小米财报会“干货”满满：下半年新车将至，YU7补齐短板，出海首站锁定欧洲

2026年科大讯飞智能办公本怎么选？3款高口碑型号，职场办公学习好帮手

2026科大讯飞学习机怎么选？2款家长力荐机型，护眼又智能助力孩子高效学

热门内容

本栏最新

10万级纯电SUV新选择！上汽MG 4X上市，半固态电池后驱配置全都有

全新一代问界M9上市！47.98万起售，配置拉满或成SUV市场新标杆

问界新M9升级来袭：从50万到80万，豪华配置再进阶冲击高端市场

上汽MG 4X正式登场！限时权益价9.28万起，续航配置亮点多

全新一代问界M9上市！47.98万起售，双动力多布局开启豪华出行新体验

全新AMG GT纯电四门跑车首秀：电动化与智能化加持，百万级性能新标杆？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.