ITBear旗下自媒体矩阵:

DeepSeek-V3.1升级发布:强化Agent能力,API调用价格即将调整

   时间:2025-08-22 04:37:50 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

DeepSeek近日宣布了DeepSeek-V3.1版本的正式发布与开源,这一更新为用户带来了多项关键改进。

新版本引入了混合推理架构,用户可以在思考模式与非思考模式间灵活切换,这一特性显著增强了模型的适应性和实用性。同时,DeepSeek-V3.1的文本处理能力得到了大幅提升,现在能够处理长达128k的上下文,满足了更多复杂场景的需求。

在思考效率方面,与DeepSeek-R1-0528相比,V3.1的思考模式能够在更短的时间内提供答案,大大提升了用户体验。通过Post-Training优化,新模型在工具使用和智能体任务中的表现也取得了显著进步,展现了更强的agent能力。

为了确保用户能够即时享受到这些改进,DeepSeek的官方网页、APP、小程序以及API开放平台上的模型均已更新至最新版本。用户只需点击对话框中的“深度思考”按钮,即可轻松在两种模式间切换。

对于开发者而言,API接口的调用方式保持不变,且新增了对Anthropic API格式的支持,这意味着开发者可以更加便捷地接入Claude Code框架,进一步拓宽了DeepSeek的应用场景。

在性能测试中,DeepSeek-V3.1也展现出了卓越的表现。在代码修复测评SWE和命令行终端环境下的复杂任务测试中,V3.1相比之前的DeepSeek系列模型有了明显提升。特别是在需要多步推理的复杂搜索测试和多学科专家级难题测试中,V3.1的性能已经大幅领先于R1-0528。

经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现仍然与R1-0528持平,这证明了其高效的推理能力。同时,在非思考模式下,V3.1的输出长度也得到了有效控制,与DeepSeek-V3-0324相比,能够在输出长度明显减少的情况下保持相同的模型性能。

据了解,DeepSeek-V3.1的Base模型在V3的基础上进行了外扩训练,新增了840B tokens的训练数据。目前,Base模型与后训练模型均已在Huggingface与魔搭平台开源,供用户自由使用。

另外,DeepSeek还宣布了API接口调用价格的调整,该调整将于北京时间2025年9月6日凌晨起生效。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version