ITBear旗下自媒体矩阵:

华为MWC 2026发布AI数据平台 “3+1”架构破解AI推理落地难题

   时间:2026-03-03 16:56:23 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在巴塞罗那举行的MWC 2026世界移动通信大会期间,华为数据存储产品线总裁袁远于产品与解决方案发布会上宣布,正式推出全新AI数据平台。该平台旨在破解当前AI应用在运营商核心业务中落地难的痛点,通过技术创新提升推理环节的效率与可靠性。

当前,AI技术在运营商领域的应用普遍面临“重训练、轻推理”的困境。尽管模型训练能力持续提升,但推理环节仍存在幻觉频发、响应延迟、记忆缺失等问题,导致AI难以深度融入核心业务场景。华为此次推出的“3+1”架构AI数据平台,通过针对性优化知识存储、缓存管理和记忆机制,为行业提供了系统性解决方案。

平台核心包含三大基础能力与一项调度技术。在知识处理方面,通过多模无损解析技术将文本、图像、视频等数据转化为细粒度知识单元,结合多维度检索算法,在智能查询场景中实现超过95%的检索准确率。例如在客服场景中,系统可精准识别用户需求,避免因信息理解偏差导致的无效交互。

针对推理效率优化,平台采用PB级KV Cache技术构建历史数据缓存池。该技术不仅支持单次对话中上下文窗口的动态扩展,更可在多轮对话中智能复用历史缓存数据,避免重复计算。实测数据显示,首Token生成时延降低达90%,显著提升模型响应速度,特别适用于高并发客服场景。

记忆管理机制是平台的另一创新点。通过构建结构化记忆库,系统可自动萃取业务场景中的历史数据与经验,形成可追溯的记忆单元。在商业数据分析场景中,这种机制使模型能够基于历史案例进行类比推理,随着使用频次增加,推理精准度持续提升,实现“越用越聪明”的自我进化能力。

支撑三大能力协同运作的是UCM(Unified Context Management)推理记忆数据管理技术。该技术采用三层缓存架构,对知识库、KV Cache和记忆库进行分级存储与智能调度。通过动态分配计算资源,确保不同业务场景下推理任务获得最优支持,同时降低整体能耗。

为满足不同规模企业的部署需求,平台提供两种架构方案。一体化部署模式以OceanStor A800存储系统为底座,集成全部AI能力模块,在保证高性能的同时支持横向扩展;分离式部署则采用“数据引擎节点+OceanStor Dorado”架构,允许企业在现有存储系统上叠加AI引擎,实现业务平滑迁移的同时保护既有投资。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version