AI领域再掀波澜！Anthropic推Sonnet 4.6，操作电脑近人类，性能媲美旗舰且价格亲民

时间：2026-02-18 04:30:28 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域再掀波澜，Anthropic公司正式推出新一代模型Claude Sonnet 4.6，以中端定价提供接近旗舰水平的性能表现。这款模型在编程、计算机操作、长文本推理等核心能力上实现突破性升级，定价却仅为旗舰Opus模型的五分之一，引发行业对AI定价策略的重新审视。据测试数据显示，Sonnet 4.6在多个基准测试中达到甚至超越了成本高出五倍的竞品表现。

在计算机操作能力方面，Sonnet 4.6在OSWorld基准测试中取得72.5%的得分，较前代模型提升11.1个百分点，接近人类操作水平。该测试模拟真实软件环境，要求模型通过虚拟鼠标键盘完成复杂任务。某保险科技公司CEO透露，其内部测试显示新模型在处理保险系统自动化时准确率达94%，具备自主故障排查和自我修正能力。Anthropic特别强调，新模型在抵御提示注入攻击方面取得重大进展，有效降低恶意指令劫持风险。

编程能力成为开发者关注的焦点。早期测试显示，70%的开发者在代码修改任务中更倾向选择Sonnet 4.6而非前代模型，59%的开发者认为其表现优于去年11月发布的旗舰Opus 4.5。在SWE-bench Verified编码测试中，Sonnet 4.6取得79.6%的得分，与Opus 4.6的80.8%几乎持平。GitHub产品副总裁指出，该模型在跨代码库搜索和复杂修复任务中表现尤为突出，显著提升大规模智能体编程的解决率。

定价策略引发市场震动。Sonnet 4.6维持每百万token输入3美元、输出15美元的定价体系，而旗舰Opus模型定价高达其五倍。这种成本效益的质变正在改变企业部署策略。某金融科技公司算笔账：处理1000万token的AI智能体若采用Sonnet 4.6，年度成本可节省数百万美元。Hex Technologies首席技术官表示，除极端分析任务外，新模型在所有工作负载中均达到Opus级性能，成为更优选择。

百万token级上下文窗口赋予模型长期规划能力。在Vending-Bench Arena商业模拟测试中，Sonnet 4.6展现出战略级决策能力：前期重金投入产能扩张，后期转向利润最大化，最终模拟利润较前代模型提升171%。这种跨长周期的推理能力，标志着AI智能体向实际业务运营迈出关键一步。Anthropic透露，某制造业客户已利用该能力优化供应链管理，实现库存成本降低23%。

行业竞速进入白热化阶段。Sonnet 4.6发布前12天，Anthropic刚推出旗舰模型Opus 4.6，这种快速迭代节奏折射出AI领域的激烈竞争。市场反应显示，该模型在智能体计算机使用、金融分析等关键指标上超越Google Gemini 3 Pro和OpenAI GPT-5.2。值得关注的是，印度IT巨头Infosys同步宣布将Claude模型整合至Topaz AI平台，服务银行、电信等行业客户，这被视为Anthropic加速企业市场渗透的重要信号。

开发者生态呈现明显迁移趋势。AI编程工具Cursor创始人称，Sonnet 4.6在长期任务和复杂问题解决上显著优于前代；CodeRabbit AI副总裁直言其在多数实际场景中超越重量级竞品。Box平台首席技术官透露，新模型在企业文档推理任务中准确率提升15个百分点，Replit总裁则用"非凡"形容其性能成本比。这些反馈表明，中端模型正在侵蚀高端市场的传统优势。

资本市场对技术突破反应强烈。iShares科技软件ETF年内跌幅超20%，反映投资者对AI颠覆风险的担忧。Anthropic新模型展现的编程能力进步，进一步加剧这种焦虑。公司CEO达里奥·阿莫代伊坦言，从实验室演示到受监管行业落地存在巨大鸿沟，而Infosys等合作伙伴正在帮助弥合这种差距。数据显示，印度市场已贡献全球6%的Claude使用量，成为关键增长极。

这一设计颠覆了传统航空升力体的原理，通过将气动结构直接嵌入车身框架，不仅减少了30%的额外部件，还实现了比传统超跑高40%的下压力效率。从智能手机到智能家居，再到智能汽车，小米正通过其生态链优势，重塑人、车、…

小米VGT超跑亮相北京车展小米VisionGranTurismo超跑国内首秀，成车展焦点。雷军称VGT项目不考虑量产，旨在探索未来汽车设计。设计与技术亮点外观：水滴状流线设计，融合小米家族式元素。技术：创新“…

当小男孩来到小米首款概念超跑VisionGranTurismo的展台时，他的情绪达到了高潮。小车迷的热情不仅让我们看到了未来汽车文化的希望，也让我们思考如何在科技迅猛发展的时代，培养下一代对创新和科技的热爱与…

在小米首款概念超跑VisionGranTurismo的展台前，这位小车迷的情绪达到了顶点。对此，小米科技创始人雷军在社交平台上分享了这一趣事，并幽默称这位小车迷为“懂车弟”。尤其是在电动车与智能汽车逐渐成为市…

长安逸动用终身质保和极致油耗打安全牌；荣威D6用吉尼斯纪录和终身质保打价值牌；荣威M7黑马版用设计和长续航打个性牌；极狐S3用换电和超大空间打灵活牌；荣威i6用超高性价比和智能座舱打燃油牌；吉利银河A7用超长…

报道称，美国和中国都计划在月球南极建立基地，并希望开采那里的冰冻水、氢和氦。十年前，前美国外交官詹姆斯·刘易斯在国会委员会作证时表示，美国在与苏联的登月竞赛中获胜后“基本上对太空失去了兴趣”，而中国正在加…

处理器与其它版本相同，高通的第五代骁龙8至尊版，在3nm工艺制程下，CPU、GPU、NPU等核心，性能均大提升。影像重点升级后置，分别有2亿像素的大底主摄、5000万像素的潜望长焦、5000万像素的超广角…

在安卓厂商为了实用性回归直屏的时候，苹果反而开始尝试通过微曲面来提升视觉高级感。如果苹果最终决定将四微曲屏落地，如何在保持设计美感的同时，有效解决误触和耐用性这两大长期困扰用户的痛点，将成为考验其硬件设计功…

第一是高能量密度，否则关节会过大过重，连自己的肢体都抬不动；第二是高矫顽力，电机在高速旋转下产生热，磁铁温度可能到 120 度以上，低矫顽力的磁铁会在高温下退磁；第三是一致性和良率，量产爬坡需要每一台电机的性…

IT之家 4 月 26 日消息，据科技媒体 TechPower Up 今天报道，市场调研机构 Sigmaintell预测，苹果今年年底有望成为全球第三大笔记本电脑制造商。同时，主打平价市场的 MacBoo…

接下来不得不说的就是性能了，毕竟很多人买小平板就是因为它方便打游戏，那么问题来了：假如我不买联想拯救者这种性能小平板，就喜欢 OPPO这种轻薄的但是又想打游戏，它能胜任吗？虽然妙控键盘相当笨重，但确实…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.