ITBear旗下自媒体矩阵:

​寒武纪快速适配DeepSeek-V3.2-Exp模型,开源vLLM-MLU引擎助力高效计算​

   时间:2025-09-30 15:44:26 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,深度求索公司正式推出了一款实验性版本的大模型——DeepSeek-V3.2-Exp。作为人工智能领域的新探索,该模型一经发布便引发了行业广泛关注。与此同时,寒武纪公司宣布已完成对该模型的适配工作,并同步开源了其大模型推理引擎vLLM-MLU的源代码,为开发者提供更高效的工具支持。

寒武纪方面表示,公司始终将大模型软件生态建设作为核心战略之一,致力于为包括DeepSeek在内的主流开源大模型提供技术支撑。凭借长期积累的技术优势和活跃的生态体系,寒武纪在DeepSeek-V3.2-Exp发布当日即实现了模型架构的适配与优化,展现了其快速响应能力。

在技术实现层面,寒武纪通过Triton算子开发框架完成了对DeepSeek-V3.2-Exp的快速适配,同时利用BangC融合算子技术进一步挖掘硬件性能潜力。公司创新性地采用计算与通信并行策略,使模型推理效率达到行业领先水平。这一系列优化措施,结合DeepSeek-V3.2-Exp引入的Sparse Attention机制,显著降低了长序列场景下的训练与推理成本。

此次合作不仅体现了寒武纪在AI芯片领域的深厚积累,也展示了其与生态伙伴协同创新的能力。通过软硬件深度融合,双方共同为客户提供了更具竞争力的解决方案,为人工智能技术在复杂场景中的应用开辟了新路径。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version