ITBear旗下自媒体矩阵:

DeepSeek V3.1升级:Agent能力跃升,混合推理模式上线,价格有所调整

   时间:2025-08-22 17:05:10 来源:第一财经资讯编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在科技界的翘首以盼中,虽然备受瞩目的R2模型未能如期亮相,但DeepSeek团队却适时推出了其最新力作——V3.1模型。此次发布虽从版本号上看似一次小幅迭代,实则标志着DeepSeek在智能体技术领域的又一重要进展。

DeepSeek官方将V3.1誉为“智能体时代的初探”,强调了该模型在Agent能力、思考模式及效率上的三大飞跃。通过精心设计的后训练优化策略,V3.1在工具运用及智能体任务中的表现显著提升,特别是在编程智能体与搜索智能体的测评中,相较于前代模型,展现出了更为卓越的能力。

V3.1采用了创新的混合推理架构,这一设计使得模型能够在思考模式与非思考模式间灵活切换,满足了不同场景下的需求。用户现已可在DeepSeek的官方App与网页端体验这一功能,通过简单的“深度思考”按钮,即可轻松切换模式。同时,DeepSeek API也完成了同步升级,deepseek-chat专注于快速响应的非思考模式,而deepseek-reasoner则专注于深度思考的思考模式,且两者的上下文容量均扩展至128K。

用户对于V3.1的混合推理架构反响热烈,认为这一设计完美平衡了深度思考与快速响应的需求,预示着实用人工智能的美好未来。一位网友评论道:“在深度推理与快速反应间自由切换,这一创意堪称天才之举。”

在提升思考能力的同时,V3.1也注重效率的优化。官方数据显示,V3.1-Think在保持与DeepSeek-R1-0528相当答案质量的同时,响应速度更快。经过思维链压缩训练,V3.1-Think在减少20%-50%输出token数的情况下,各项任务表现依然稳健。

V3.1在非思考模式下的输出长度也得到了有效控制,相较于DeepSeek-V3-0324,在输出长度显著减少的同时,模型性能依然保持不变。值得注意的是,随着V3.1的推出,DeepSeek也对API接口调用价格进行了调整。自9月6日起,取消了夜间时段优惠,输入价格调整为缓存命中时0.5元/百万tokens,缓存未命中则为4元/百万tokens(此前V3为2元/百万tokens);输出价格则上调至12元/百万tokens(此前V3为8元/百万tokens)。

在技术层面,V3.1的基础模型在V3的基础上进行了外扩训练,新增了840B tokens的训练数据。这些基础模型与后训练模型均已在Huggingface与魔搭平台上开源,供开发者与研究者使用。DeepSeek此次还宣布了对海外模型Anthropic API格式的支持,用户可以将V3.1的能力无缝接入Claude Code框架,进一步拓宽了模型的应用场景。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version