ITBear旗下自媒体矩阵:

Agentic AI浪潮下,华为以软硬件协同创新构建国产算力新范式

   时间:2026-05-24 03:41:04 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

随着OpenClaw、Hermes等智能体推动AI从对话交互向任务执行转型,相关应用的Token消耗量在半年内增长至原来的6倍,Agentic AI引发的算力需求重构正在重塑整个产业格局。面对这一趋势,华为在鲲鹏昇腾开发者大会上提出了系统性解决方案,从芯片架构到软件生态构建了多层次技术体系。

华为半导体首席科学家廖恒指出,Agentic AI时代对AI芯片提出了差异化需求。在预训练、推理Prefill与Decode等不同业务场景中,算力、内存带宽、内存容量和互联IO带宽四大核心指标的优先级存在显著差异。其中,芯片互联能力直接决定了超节点的计算效能上限,这成为突破算力瓶颈的关键突破口。

昇腾950芯片通过架构创新实现了超节点性能跃升。该芯片采用新型互联技术,构建出带宽更高、延迟更低、覆盖范围更广的节点网络,使系统综合性能达到超节点规模与单芯片性能的乘积效应。这种深度协同设计贯穿芯片架构、系统架构、集群架构和软件架构四个维度,配合CANN基础软件的持续优化,在保持生态兼容性的同时显著提升了运行效率。

在软件生态建设方面,华为全面开源CANN计算架构,为开发者提供完整的算子开发工具链。通过实现Triton和TileLang编程接口的100%兼容,将算子开发周期压缩至一周以内。目前该平台已支持超过600个Triton算子和300个TileLang算子,覆盖主流模型的关键计算单元。北京大学研究团队证实,TileLang框架在DeepSeek V4模型推理中展现出显著优势,验证了昇腾平台对前沿模型的技术支撑能力。

通用计算领域正在经历范式转变。华为ICT操作系统专家胡欣蔚透露,鲲鹏计算架构正从单一模型训练场景向Agent负载优化转型,构建起包含基础硬件、异构融合层和智能调度层的三层体系。这种设计实现了智能计算与通用计算的软硬协同,为大规模智能体部署提供了算力保障。

针对Agent应用的特殊需求,鲲鹏超节点创新采用多级缓存共享架构,结合增量快照共享和快速状态分叉技术,将任务回滚延迟控制在十毫秒级别。实验数据显示,这种设计使Agent任务成功率提升超过10%。在通信加速方面,灵衢SGL特性降低20%网络延迟,透明UBSocket技术实现应用无感知的时延优化,共享TP技术则减少90%的通信内存占用。

性能优化延伸至存储和检索环节。通过共享内存实现的Buffer Pool预热机制,配合分布式全局图索引技术,使多模态检索效率提升一倍。上下文缓存技术的应用则减少50%的Token重复消耗,显著降低了智能体运行的资源开销。这些技术创新共同构建起高密度、低延迟、高并发的沙箱基础设施,为Agent生态发展奠定技术基石。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version