人工智能公司Anthropic近日推出其Sonnet系列模型的最新版本——Sonnet 4.6测试版,标志着该公司每四个月一次的模型迭代周期持续推进。此次更新重点强化了代码生成、复杂指令处理及计算机交互能力,同时将上下文窗口容量扩展至100万token,相当于可一次性解析完整代码库或数十篇学术论文。
新模型将作为免费用户和专业版用户的默认选择,其上下文处理能力较前代提升一倍。Anthropic技术团队指出,这种扩展使得模型能够处理更复杂的任务场景,例如分析长篇法律文书或跨文件代码审查。值得注意的是,该版本发布距离旗舰模型Opus 4.6的推出仅间隔两周,显示出公司加速技术落地的战略节奏。
在性能测试中,Sonnet 4.6在多项专业基准上刷新纪录。其中在计算机操作评估平台OS World和软件工程测试集SWE-Bench上均取得突破性进展,更在衡量通用智能的ARC-AGI-2测试中达到60.4%的准确率。尽管这一成绩超越了同规模竞品,但与Opus 4.6、Gemini 3 Deep Think等顶级模型仍存在差距,某精调版GPT 5.2也保持领先优势。
据内部人士透露,轻量级Haiku模型的升级版本正在进行最终测试,预计将在未来三周内完成部署。这种多层级模型协同更新的策略,显示出Anthropic构建完整AI产品矩阵的野心。随着上下文处理能力的突破,专业开发者群体对Sonnet 4.6的部署应用表现出浓厚兴趣,部分金融机构已启动内部测试。











