在华为中国合作伙伴大会的现场,华为昇腾计算基础软件业务总经理李守平接受了一场深度访谈。当话题聚焦于CANN(Compute Architecture for Neural Networks)全量开源后,在超节点集群上运行万亿参数大模型时如何实现更高算力利用率与更低时延时,他给出了极具技术深度的解答。
李守平指出,CANN所面对的是一个包含计算、单元间连接等多个核心模块的完整系统。要实现算力价值的最大化,关键在于如何将这些模块进行有效整合,这本质上是一场系统性创新。他特别提到,华为的超节点集群与业界传统集群有着本质区别。传统集群往往只是简单堆砌旧节点,而华为的超节点集群实现了统一内存和统一编址。这一创新从协议层面减少了数据包和额外开销,使得底层负载大幅减轻。
在硬件层面取得突破的同时,华为在软件层面也进行了深度优化。通过专家并行标准化设计,华为超节点集群能够充分利用高带宽优势。即便在面对万亿参数大模型需要切分资源的情况下,也能将带宽优势发挥到极致,避免资源浪费。这种软硬件协同优化的方式,为提升算力利用率和降低时延提供了有力保障。
华为在生态战略上的转变同样引人注目。过去,行业在国产替代方面更多处于被动防御阶段,主要关注能否运行CUDA代码,试图在他人搭建的技术框架内进行修补。而如今,随着CANN的全量开源和超节点协议的主动开放,华为的战略重心已经从构建自主能力转向共建开放标准。这一转变意味着华为不再满足于产品“可用”,而是希望将底层技术的定义权交还给社区,与全球开发者共同构建一个开放协作的生态系统。
李守平提到的“统一内存编址”和“协议层减负”,体现了华为用软件定义思维重塑硬件边界的技术理念。这种思路与当年Linux对抗Unix的路径颇为相似。当底层技术足够透明,上层的应用创新才能获得更广阔的发展空间。对于国内众多面临算力成本高昂、定制需求难以满足困境的AI初创公司而言,华为的这一技术理念或许提供了一个全新的发展方向:与其在他人构建的技术体系中修修补补,不如基于自主技术打造属于自己的创新土壤。
尽管华为在技术创新和生态战略上取得了显著进展,但挑战依然存在。CUDA经过二十年的发展,已经积累了深厚的技术底蕴,这不是通过一次开源就能完全追赶上的。开发者习惯的迁移、工具链的完善程度,都需要时间的沉淀和持续的优化。然而,华为选择的技术发展方向无疑是正确的。当国产算力从单纯的硬件销售转向能力输出,从技术兼容者转变为标准定义者,这场关于AI基础设施的竞争才真正进入了更具挑战性的阶段。











