ITBear旗下自媒体矩阵:

DeepSeek-V3.1升级发布:混合思考模式提升效率,智能体能力显著增强

   时间:2025-08-22 00:43:10 来源:21世纪经济报道编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在人工智能领域,DeepSeek团队近日悄然推出了其最新力作——DeepSeek-V3.1,距离前代产品DeepSeek-V3问世仅五个月之久。此次升级被DeepSeek视为向“智能体时代”迈进的重要一步,迅速在业界掀起了波澜。

8月21日,DeepSeek官方正式宣布DeepSeek-V3.1(简称V3.1)的问世,而早在两天前的官方社群中,这一消息便由DeepSeek小助手提前透露,引发了广泛讨论。目前,V3.1在HuggingFace趋势榜上已攀升至第二位,足见其影响力。

V3.1的升级亮点主要集中在三个方面:混合思考模式、思考效率的提升以及更强大的智能体能力。其中,混合推理架构的引入尤为引人注目。这一架构使得V3.1能够同时支持思考模式与非思考模式,大大增强了模型的灵活性。更V3.1的上下文处理能力从原有的64k扩展至128k,意味着它能够处理更长的文本信息,这对于复杂问题的理解尤为关键。

在思考效率方面,V3.1同样表现出色。经过思维链压缩训练,V3.1-Think在减少输出token数20%-50%的同时,保持了与R1-0528相当的任务平均表现。在非思考模式下,V3.1的输出长度也得到了有效控制,相较于DeepSeek-V3-0324,它在输出更简洁的同时,保持了模型的原有性能。

智能体能力的增强是V3.1的另一大亮点。通过后训练优化,V3.1在工具使用和智能体任务中的表现显著提升。在编程任务测试中,V3.1在代码修复和复杂命令行终端环境下的表现均优于之前的DeepSeek系列模型。特别是在AiderPolyglot多语言编程测试中,V3.1取得了71.6%的高分,超越了Claude 4 Opus和DeepSeek R1等竞争对手。同时,其完成每次完整编程任务的成本仅为1.01美元,远低于专有系统的成本。

搜索任务方面,V3.1同样展现出了强大的实力。在多项搜索评测指标上,V3.1取得了显著提升。特别是在需要多步推理的复杂搜索测试(browsecomp)和多学科专家级难题测试(HLE)中,V3.1的性能已大幅领先R1-0528。

V3.1在多语言支持能力上也进行了显著优化。目前,它能够处理超过100种语言,特别针对亚洲语言和资源较少语种进行了优化,进一步拓宽了其应用场景。

DeepSeek-V3.1的推出,不仅标志着DeepSeek团队在人工智能领域的又一次重要突破,也为行业带来了新的发展机遇。随着智能体时代的到来,V3.1有望成为推动行业变革的重要力量。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version