DeepSeek公司近日震撼发布其最新一代大语言模型——DeepSeek-V3.1,此举标志着全球AI市场竞争的进一步白热化。此次更新通过引入创新的混合推理架构和显著增强的智能体能力,为AI领域带来了革命性的变化。
DeepSeek-V3.1的核心亮点在于其革命性的混合推理架构,这一架构使模型能够在同一框架下灵活切换“思考”与“非思考”两种模式。据官方公告,新版本经过深度训练和优化,在工具使用、编程、搜索等智能体任务上的表现实现了质的飞跃。尤为V3.1采用了针对下一代国产芯片设计的UE8M0 FP8 Scale参数精度。
社区测试数据揭示了新模型的卓越性能。在Aider多语言编程基准测试中,DeepSeek-V3.1的得分超越了Anthropic的Claude 4 Opus,并且在成本控制上展现出显著优势。这一成绩迅速在开发者社区中引发了热烈反响,模型在Hugging Face平台上的关注度飙升。
为了提升用户体验,DeepSeek同步升级了API接口,不仅将上下文窗口扩展至128K,还新增了对Anthropic API格式的支持,极大简化了迁移过程。更为关键的是,公司宣布将于2025年9月6日起实施新的API定价方案,并取消夜间优惠,这一举措被视为其在服务能力大幅提升后加速商业化进程的重要一步。
混合推理架构的引入,标志着DeepSeek正迈向智能体时代的新篇章。据DeepSeek官网介绍,此次升级带来了多项重大变化:混合推理架构让模型同时支持思考模式与非思考模式,思考效率显著提升,相比前代模型,DeepSeek-V3.1-Think能在更短时间内给出答案。通过Post-Training优化,新模型在工具使用和智能体任务中的表现得到了大幅提升。
在效率方面,新的思考模式经过思维链压缩训练,相比上一代模型,在任务表现相当的情况下,token消耗量减少了20%至50%。这一改进不仅提升了模型的性能,还降低了运行成本,增强了其在商业场景中的竞争力。
新模型在编程和搜索等智能体能力方面实现了显著增强。DeepSeek公布的数据显示,V3.1在代码修复和命令行终端任务测试中,性能相较于公司以往模型有了明显提高。在复杂搜索测试中,模型同样表现出色,大幅领先于竞争对手。社区进行的第三方测试进一步证实了V3.1在编程能力上的跃升,其在Aider编程基准上取得了71.6%的高分,超越了多个知名模型,且成本效益显著。
在开源与API更新方面,DeepSeek继续其开放策略,将V3.1的Base模型和后训练模型发布在Hugging Face与魔搭社区上。此次发布的模型参数量为685B,Base模型在V3基础上进行了额外的840B token训练。公司提醒开发者注意,新模型采用了新的参数精度,且分词器和聊天模板有所调整,部署时需参考最新文档。
API服务也迎来了全面升级。除了扩展上下文长度外,DeepSeek还为开发者提供了更强大的工具调用功能,如支持strict模式的Function Calling,以确保输出格式的规范性。为降低生态迁移成本,API增加了对Anthropic API格式的兼容支持,方便使用Claude Code框架的开发者接入DeepSeek模型。
在技术与产品更新的同时,DeepSeek也迈出了坚定的商业化步伐。公司宣布将于2025年9月6日起调整API接口调用价格,并取消夜间时段优惠。这一调整旨在更好地满足用户调用需求,并伴随着API服务资源的扩容。