近日,国家超算互联网AI社区迎来了一位新成员——DeepSeek-V3.2-Exp模型。这款由DeepSeek推出的实验性版本,依托国产深算智能加速卡与全国一体化算力网,于9月30日正式上线该社区,供企业和开发者免费下载使用,助力快速开发。
作为迈向新一代架构的重要过渡,DeepSeek-V3.2-Exp在继承V3.1-Terminus版本优势的基础上,引入了创新的DeepSeekSparseAttention(DSA)稀疏注意力机制。这一机制首次实现了细粒度稀疏处理,能够在几乎不降低模型输出质量的前提下,显著提升长文本的训练和推理效率,为大规模语言模型的应用开辟了新的可能。
DeepSeek-V3.2-Exp的发布,标志着DeepSeek在探索新一代架构的道路上迈出了坚实的一步。该版本不仅是对现有技术的优化,更是对未来模型发展方向的一次重要验证,为后续技术迭代提供了宝贵的经验。
与此同时,国家超算互联网AI社区已汇聚超过700款国内外优质开源模型,其中不乏DeepSeek-V3.1-Terminus、DeepSeek-R1-0528、DeepSeek-R1以及DeepSeek-V3等DeepSeek系列明星产品。开发者只需登录该社区,即可享受包括API调用、Chatbot在线推理对话、国产大模型分布式训练及微调等在内的MaaS(模型即服务)一站式解决方案。