滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

华为UCM技术革新AI推理：三级存储架构助力高效低耗

时间：2025-08-13 03:10:00 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

在近日举办的2025金融AI推理应用落地与发展论坛上，华为数据存储产品线的重要人物周跃峰博士揭晓了一项名为UCM（推理记忆数据管理器）的创新技术。这项技术专注于优化KV Cache管理，通过整合多种缓存加速算法工具，对推理过程中产生的KV Cache数据进行分级管理，有效扩大了推理上下文窗口。

UCM技术的核心在于其三级存储架构，它巧妙地利用了不同存储介质的优势。最热的数据被存储在高速的HBM中，以供实时高频访问；短期较热的数据则存放在服务器的DRAM中；而其余数据则被妥善安置在专业外置存储中。这一设计旨在提升AI推理系统的整体效率和性能。

据华为官方透露，UCM技术不仅实现了高吞吐、低时延的推理体验，还显著降低了每Token的推理成本。更为重要的是，华为计划于今年9月在魔擎社区首次发布UCM的开源计划，并逐步向业界主流推理引擎社区推广，与所有Share Everything存储厂商和生态伙伴共享这一创新成果。

与此同时，中国信息通信研究院人工智能研究所平台与工程化部主任曹峰也强调了当前AI推理领域面临的一个关键问题：高昂的HBM价格使得显存成为制约大模型和AI芯片性能的一大瓶颈。为了应对这一挑战，业界已经达成共识，采用外置存储来解决长序列推理问题，而KV Cache的优化则成为提升推理架构性能的关键所在。

更多>同类资讯

低门槛理财新玩法：用“拖拉机”套利，小钱积成大收益

10-15

吉林一金矿探矿权及附属物931轮激烈竞价，最终以1505万成交，溢价率489%

10-15

从养殖起步到重工业巅峰：东方希望坚守实业，不上市却年营收1784亿

10-15

守护千年文明瑰宝：共筑应县木塔保护传承传播新篇章

10-15

火星殖民：开启多行星文明新篇，重塑人类文化与未来格局

10-15

古老折纸邂逅现代太空工程：“绽放模式”开启宇宙探索新想象

10-15

星舰第十一次试飞完美“出发并回家”，为人类登月登火梦注入新动力

10-15

星舰“十一飞”圆满落幕：二代星舰完美收官，三代星舰蓄势待发

10-15

星际彗星3I/ATLAS打破认知：4.5亿公里外喷水，或携银河系古老“记忆”

10-15

美国Radiant公司选址“曼哈顿计划”旧址，2026年建全球首座可移动核反应堆工厂

10-15

小米入局短剧赛道，“围观短剧”App无广告畅享20+题材海量短剧

10-15

中兴Co-Sight 2.0登顶全球榜单：以创新架构破解AI痛点，引领智能体产业落地

10-15

JEDEC发布DDR5 SPD年度标准更新新增三项技术支持扩展高速内存

10-15

天猫团队灵隐寺祈福盼降温助双十一，江浙沪降温成“玩梗”预热

10-15

美国加速推进月球核反应堆计划，欲借核能抢占太空竞赛先机？

10-15

点击查看更多 +

全站最新

京东携手宁德时代、广汽推“国民好车”，京东11.11期间独家发售

21世纪初车坛群英荟萃：性能巅峰碰撞，经典车型闪耀黄金年代

从赛车到日常：MOMO改装方向盘，为驾驶注入别样质感与乐趣

京东“双11”跨界“造”车：联合车企推国民好车，数码家电订单增超七成

京东不造车却卖车：以“反向定制”入局，刘强东的生态棋局能否破局？

铜陵首个汽车维修绿色钣喷共享中心投用，以共享模式推动汽修行业绿色转型

热门内容

本栏最新

Sora上线iOS后表现亮眼，安卓版Google Play预注册已开启

科大讯飞AI写作助手2025年11月30日将停运，用户需及时备份迁移数据

Sora上线五天下载量破百万，美区App Store榜单力压ChatGPT和Gemini

中科院团队全固态电池研究获突破：零压运行+高倍率，商业化之路再进一步

DevDay新动向：OpenAI或以ChatGPT为入口重构软件世界秩序

安徽合肥飞行教员王先生一家驾机返乡，300公里1小时20分，“空中睡床”引热议

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.