ITBear旗下自媒体矩阵:

DeepSeek-V3.2-Exp模型开源上线 稀疏架构助力效率提升API降价超五成

   时间:2025-09-30 15:19:58 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,人工智能领域迎来重要进展——DeepSeek官方宣布推出并开源其全新大语言模型DeepSeek-V3.2-Exp。该模型通过引入创新性的稀疏注意力架构,在保持输出质量的同时显著降低了计算资源消耗,尤其针对长序列文本处理场景实现了效率突破。

作为实验性版本,V3.2-Exp被定位为新一代架构的过渡性探索。其核心创新在于首次实现了细粒度稀疏注意力机制(DeepSeek Sparse Attention),该机制通过动态筛选关键信息交互,在不影响模型性能的前提下,将长文本场景下的训练与推理效率提升至全新水平。官方数据显示,相较于前代V3.1-Terminus模型,新架构在处理超长文本时资源占用率下降30%以上。

技术团队透露,DSA架构的突破性在于解决了传统注意力机制在长序列处理中的计算瓶颈。通过动态构建注意力连接图,模型能够自动识别并强化重要信息关联,同时弱化冗余计算。这种设计既保持了模型对复杂语义关系的捕捉能力,又避免了全量注意力计算带来的性能损耗。

伴随模型升级,DeepSeek同步调整了服务策略。目前官方App、网页端及小程序均已完成版本更新,同时宣布API服务价格下调超50%。此次降价覆盖所有调用场景,开发者使用成本显著降低,此举被视为推动AI技术普惠化的重要举措。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version