ITBear旗下自媒体矩阵:

华为推出AI推理新技术UCM,计划2025年9月于魔擎社区首开源

   时间:2025-08-13 03:32:01 来源:IT之家编辑:快讯团队 IP:北京 发表评论无障碍通道
 

华为近期宣布了一项重大技术创新,正式推出了名为UCM(推理记忆数据管理器)的AI推理加速解决方案。这一创新技术专为提升AI推理性能而设计,旨在通过优化缓存管理,实现更高效、低成本的推理运算。

UCM的核心在于其以KV Cache为基础的推理加速架构。该技术融合了多种先进的缓存加速算法,能够智能地分级管理推理过程中累积的KV Cache数据。这种管理方式不仅扩大了推理的上下文窗口,还显著提高了推理的吞吐量和降低了时延,有效减少了每Token的推理成本。据华为透露,UCM已经在多个实际业务场景中得到了验证,特别是在中国银联的“客户之声”、“营销策划”以及“办公助手”三大业务领域中,展现出了卓越的AI推理加速效果。

华为方面表示,他们计划在2025年9月将UCM技术正式开源,首发平台将是魔擎社区。未来,该技术将逐步向业界主流的推理引擎社区开放,并与所有Share Everything(共享架构)存储厂商及生态合作伙伴共享。这一举措无疑将为AI推理技术的发展注入新的活力,推动整个行业的创新与进步。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version