ITBear旗下自媒体矩阵:

DeepSeek与寒武纪同步发力:新模型发布与适配优化共启AI新篇

   时间:2025-09-30 03:09:06 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国内人工智能领域两大领军企业DeepSeek与寒武纪近日同步推进重要技术进展,引发行业高度关注。9月29日傍晚,DeepSeek通过官方渠道率先发布新一代实验性模型DeepSeek-V3.2-Exp,该版本在原有V3.1-Terminus架构基础上引入创新的稀疏注意力机制,重点优化长文本场景下的训练与推理效率。

据技术团队介绍,此次升级的DeepSeek Sparse Attention技术通过动态调整计算资源分配,有效降低了长序列处理过程中的算力消耗。为加速生态建设,DeepSeek同步下调API调用价格超50%,并完成官方应用、网页端及小程序的全平台更新。开发者现可通过原有接口直接调用新模型,享受更高效的算力支持与更低的开发成本。

紧随其后,寒武纪于18时11分通过开发者平台宣布完成技术适配。其自主研发的vLLM-MLU推理引擎源代码已实现开源,开发者可在寒武纪软硬件一体化平台上直接部署DeepSeek-V3.2-Exp模型。技术文档显示,此次适配通过Triton算子开发与BangC融合算子技术,使新模型在寒武纪芯片上的计算效率达到行业领先水平。

寒武纪研发团队透露,针对稀疏注意力机制特性,公司采用计算通信并行策略进行深度优化。这种软硬件协同创新模式,使得长序列场景下的训练推理成本显著降低。此前双方在DeepSeek系列模型上的合作已验证了这种技术路径的可行性,此次实验性版本的快速适配进一步巩固了技术优势。

行业分析师指出,两家企业从模型发布到生态适配的紧密协作,展现了中国AI产业链在关键技术环节的协同能力。这种同步推进的技术演进模式,不仅缩短了新技术的产业化周期,更为下游应用提供了更具性价比的解决方案。特别是在需要处理超长文本的金融、法律、科研等领域,相关技术突破将带来显著效率提升。

技术文档显示,寒武纪此次开源的推理引擎包含完整的模型部署指南与性能测试工具。开发者可通过指定代码仓库获取相关资源,按照文档指引即可在寒武纪MLU系列芯片上实现模型部署。这种开放的技术生态建设,有望吸引更多开发者参与AI应用创新。

市场观察人士认为,此次技术联动标志着中国AI产业从单点突破转向系统化创新。通过模型架构创新与硬件加速技术的深度融合,国内企业正在构建具有自主知识产权的技术体系。这种发展模式或将改变全球AI技术竞争格局,为产业升级提供新的技术路径。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version