ITBear旗下自媒体矩阵:

华为“超节点+集群”破局:撞开算力枷锁,铺就中国AI智能新坦途

   时间:2025-09-21 11:29:10 来源:小AI编辑:快讯 IP:北京 发表评论无障碍通道
 

2005年,英特尔前首席执行官保罗·欧德宁提出“Tick-Tock”战略,以两年为周期交替升级制程工艺与微架构,将摩尔定律推向新高度。这项被称为“钟摆革命”的计划,不仅重塑了半导体产业格局,更奠定了英特尔在PC与服务器市场的长期优势。而在中国科技发展进程中,也曾有过类似的雄心壮志——2018年华为发布全栈全场景AI战略,次年推出昇腾910芯片,试图在AI算力领域掀起一场中国版的“钟摆革命”。

然而历史总是充满戏剧性。2019年美国将华为列入实体清单,2020年全面制裁海思,直接切断了华为的芯片供应链。这场突如其来的科技铁幕,让中国AI算力领域的发展戛然而止。原本规划中的昇腾演进路线被迫中断,中国科技企业不得不面对一个残酷现实:在AI算力这个关键领域,我们是否要永远受制于人?

六年后,答案在华为全联接大会2025上揭晓。华为副董事长徐直军宣布推出全球最强算力超节点与集群解决方案,正式公布昇腾演进路标。这一举动标志着,那个被中断六年的“钟摆革命”计划,以全新的姿态回归。徐直军强调:“算力是中国人工智能发展的关键,我们将基于现有工艺打造‘超节点+集群’方案,满足持续增长的需求。”

要理解这场回归的意义,需要回到2019年那个转折点。当时发布的昇腾910在性能上已与英伟达同期产品比肩,但制裁让这款芯片的发展戛然而止。与此同时,AI大模型参数规模从2018年BERT-large的3.4亿激增至2025年GPT-5的1.8万亿,算力需求呈现指数级增长。而英伟达则趁机巩固地位,从2018年的Turing架构升级到2025年的Blackwell Ultra及Rubin架构,牢牢掌控全球AI算力市场。

制裁的影响远不止于此。随着AI算力成为战略资源,美国持续升级对华封锁,迫使英伟达推出性能缩水的“中国特供版”GPU。这种做法的本质,是通过算力供应限制来锁死中国AI的发展上限。数据显示,中国AI产业在半导体工艺上的长期落后,导致单卡性能与供货量持续处于劣势,迫使中国AI企业只能扮演技术跟随者的角色。

面对这种困境,中国AI产业尝试了各种应对方案:囤积算力卡、优化模型架构、提升算法效率。但这些措施都只能缓解短期压力,无法从根本上解决算力困局。当被问及“如果模型参数继续膨胀怎么办?”“如果自动驾驶等新应用带来算力爆发怎么办?”时,行业普遍缺乏有效答案。中国AI需要的不是临时解决方案,而是能够支撑指数级增长的“无尽算力”。

华为的选择是回归基本原理:既然单颗芯片必然落后,那就通过多芯片组合来弥补。这种思路看似简单,实则面临巨大挑战。AI任务虽然具有高并发特性,但要将大量芯片组合成有效算力,需要解决内存带宽、互联时延、系统调度等一系列复杂问题。这就像要在棋盘上同时移动数百枚棋子,每一步都要精准计算。

华为的突破首先体现在关键技术自研上。针对高性能计算必需的HBM技术,华为开发了HiBL 1.0和HiZQ 2.0两种解决方案。前者降低了推理阶段的投资成本,后者则满足了训练对互联带宽的高要求。这些自研技术逐步瓦解了“人有我无”的技术壁垒,为算力集群化奠定了基础。

在网络互联这个传统优势领域,华为更是展现出深厚积累。通过多端口聚合、高密封装技术,以及平等架构和统一协议,华为实现了TB级超大带宽和2.1微秒超低时延的互联方案——灵衢协议。这种技术突破使得大规模算力集群成为可能,而华为也宣布将开放灵衢2.0技术规范,与产业伙伴共建生态。

这些技术突破最终汇聚成“超节点+集群”的战略方案。超节点将多个计算单元联接成统一计算体,集群则将多个超节点通过网络整合为可软件调用的算力资源。这种架构巧妙地规避了单芯片性能限制,将算力竞赛从“象棋对弈”转变为“围棋布局”——单个棋子价值有限,但整体布局能决定胜负。

2025年3月,华为推出Atlas 900超节点,集成384颗昇腾计算单元,算力达300 PFLOPS,创下全球纪录。而在全联接大会2025上发布的Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192和15488个计算单元联接,在关键指标上全面领先。基于这些超节点构建的Atlas 950 SuperCluster和Atlas 960 SuperCluster集群,算力规模分别超过五十万卡和百万卡,确立了全球最强算力集群的地位。

这种领先优势体现在具体数据上:Atlas 950超节点的算卡规模是英伟达NVL144的56.8倍,总算力是其6.7倍,内存容量是15倍,互联带宽是62倍。即使与英伟达计划2027年推出的NVL576相比,华为方案在各方面依然保持领先。这意味着无论AI大模型如何发展,华为都能提供充裕算力,实现算力供给恒定大于模型创新需求的目标。

华为的创新并未止步于AI领域。全联接大会上发布的TaiShan 950 SuperPoD通用计算超节点,结合GaussDB分布式数据库,能够替代传统大型机和小型机。这种通算+智算的混合超节点架构,为生成式推荐系统开辟了全新发展方向,展现了华为技术的广泛适用性。

“超节点+集群”战略的本质,是重构AI算力的游戏规则。当单芯片性能比较变得意义有限时,华为通过系统级创新将算力竞赛转变为整体解决方案的竞争。这种转变不仅规避了工艺限制,更将算力发展转化为华为的战略优势。正如观察家所言:“当对手改变规则时,最好的回应是创造新规则。”

这种战略转型的背后,是中国科技产业在逆境中的创新觉醒。制裁迫使中国科技企业跳出传统发展路径,在绝境中开辟新道路。华为六年来的技术积累,正是这种创新精神的集中体现。从关键技术自研到系统架构创新,从单机性能提升到集群效能优化,华为走出了一条独特的算力发展道路。

这条道路的意义不仅在于技术突破。当“超节点+集群”方案完全基于中国大陆制造能力时,它实际上为中国AI产业构建了一个自主可控的算力基座。这个基座不仅能满足当前需求,更能支撑未来通往AGI(通用人工智能)的漫长道路。国家不再需要担心算力供应,产业界也能专注于创新而非生存。

当然,这种集群化算力方案也面临挑战。软件管理复杂度和功耗问题是主要考量,但华为已经准备了充分解决方案。特别是在功耗方面,中国完善的基础设施建设和新能源发展优势,恰好转化为算力集群的竞争力。这种“恰好”的匹配,或许就是中国科技产业对外部封锁最有力的回应。

回顾华为六年来的发展轨迹,可以看到一条清晰的创新脉络:从2019年昇腾910的惊艳亮相,到制裁下的沉默积累,再到2025年“超节点+集群”的战略回归。这条道路充满了挫折与突破,但最终证明了一个道理:当外部压力切断传统发展路径时,真正的创新者会开辟出全新的道路。

如今,随着华为昇腾路标的公布,AI算力领域正迎来新的变革契机。在全球AI算力需求持续激增的背景下,华为以几乎一年一代的速度推进昇腾升级,这种发展节奏让人想起六年前的“钟摆革命”计划。不同的是,这次中国科技企业不仅带着更成熟的技术回归,更掌握着改变游戏规则的能力。

这场由华为引领的算力革命,其意义已经超越了技术层面。它向世界证明,任何试图通过封锁来阻碍中国科技发展的企图,最终都会激发出更强大的创新动力。当“超节点+集群”的算力旌旗在中国大地上展开时,它不仅代表着技术突破,更象征着一个产业在逆境中团结奋进的决心。

在这条由中国人自己撞出的算力之路上,每一步都凝聚着智慧与汗水。从关键技术突破到系统架构创新,从单机性能提升到集群效能优化,华为用实际行动诠释了什么是真正的技术创新。这条道路或许曲折,但它通向的是一个不再受制于人的未来——在那里,中国AI要多少算力,就能提供多少算力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version