ITBear旗下自媒体矩阵:

deepseek新专利:优化大语言模型部署,提升硬件利用率与系统性能

   时间:2025-08-01 15:08:51 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

近期,杭州深度求索人工智能基础技术研究有限公司,即deepseek的关联企业,在人工智能领域取得了新的技术突破。据天眼查App数据显示,该公司已成功申请了一项名为“大语言模型部署方法及系统”的专利。

该专利的核心创新点在于,它将大语言模型的部署过程巧妙地分为预填充和解码两个阶段,并根据这两个阶段的不同需求,分别部署在具备高性能计算能力和大内存的机器上。这一策略不仅有效均衡了负载任务,还最大化地利用了硬件资源,显著减少了算力的闲置情况。同时,该方法还带来了整体延迟的降低、吞吐量的提升,以及系统扩展性和容错性的显著增强。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version