ITBear旗下自媒体矩阵:

对话徐直军:华为AI算力突围,以“超节点+集群”走出自主创新路

   时间:2025-09-22 06:21:27 来源:小AI编辑:快讯 IP:北京 发表评论无障碍通道
 

在2025年华为全联接大会的现场,当“昇腾”二字以光影形式跃然于大屏幕之上时,会场内的空气仿佛凝固了一瞬。没有预想中的欢呼与掌声,取而代之的是此起彼伏的深呼吸声与泛红的眼眶。这一刻,距离2018年昇腾310芯片问世、2019年昇腾910芯片发布,已跨越两千多个日夜。这场跨越不仅记录着技术迭代的轨迹,更镌刻着一家企业在极端压力下的生存智慧。

时间回溯至2019年春,美国制裁令华为供应链骤然紧绷。彼时华为轮值董事长徐直军在发布昇腾910商用时仍保持从容,但暗流早已涌动。“当时备货的昇腾910芯片,我们只敢供给国计民生领域客户,互联网企业都不敢卖。”他坦言,这场突如其来的风暴将华为从技术高光时刻推入孤立境地,芯片之路一度被外界视为“死局”。

真正的突围始于对技术路径的重新定义。当外界聚焦于单芯片性能时,华为已转向系统级创新。2024年3月推出的Atlas 900超节点,通过384颗昇腾910C芯片构建起300 PFLOPS算力的计算集群,其CloudMatrix384云服务实例更被海外分析机构SemiAnalysis评价为“在多项关键指标上超越英伟达GB200 NVL72系统”。这种超越并非源于芯片制程优势,而是源于对计算架构的颠覆性重构。

“英特尔曾允许我们使用CPU互联协议,后来连这个都被禁止了。”徐直军揭示技术突围的艰辛历程。从光器件到互联芯片,华为不得不重新定义每个技术环节。这种全链条自主创新催生出独特的超节点架构——通过灵衢互联协议,将数万颗计算卡连接成逻辑上的单一计算体。相较于英伟达NVlink的封闭生态,华为选择开放灵衢2.0技术规范,试图构建更广阔的产业生态。

在芯片规划层面,华为展现出激进的技术演进路线。至2028年,昇腾系列将形成Ascend 950/960/970三大产品矩阵,算力密度每年翻倍提升。其中970系列支持4TB/s互联带宽,FP4算力达8 PFLOPS,自研HBM内存带宽较前代翻四番。这些参数背后,是华为对AI训练需求爆炸式增长的精准预判。

生态建设成为另一场静默的革命。面对开发者对CUDA生态的路径依赖,华为坚持打造CANN生态与MindSpore框架。“就像谈恋爱,不用怎么知道合不合适?”徐直军比喻道。这种看似“逆流”的选择,实则是为构建不受西方技术体系制约的自主生态铺路。当被问及与英伟达的竞争时,他直言:“除了单芯片算力小一点、功耗大一点,其他都是优势。”

超节点战略的深层逻辑在于将技术短板转化为系统优势。2022年英伟达DGX H100 NVL256项目因成本与可靠性问题搁浅,而华为最新发布的Atlas 950/960 SuperPoD超节点分别支持8192及15488张昇腾卡,算力规模突破百万卡级别。这种集群化部署不仅规避了芯片制程限制,更通过光通信技术实现低损耗、长距离互联——相较于英伟达的全铜通信方案,华为的光模块策略使单节点可连接芯片数量提升数个量级。

“创新有时是被逼出来的。”徐直军坦陈技术突围的无奈与必然。当海思芯片暂时失去制程优势,华为转而通过“非摩尔补摩尔”策略,在系统架构、数学算法等领域构建护城河。这种转型在灵衢互联协议上体现得尤为明显,其通过正向负向全双工传输设计,解决了大模型训练中前所未有的数据洪流挑战。

在华为的技术版图中,超节点与集群战略已上升为核心层级。这种选择既是对现实约束的妥协,更是对未来计算形态的前瞻布局。当业界仍在讨论单芯片性能时,华为已通过系统级创新证明:真正的算力革命不在于晶体管密度的竞赛,而在于如何让数万颗芯片协同演绎出超越物理极限的计算乐章。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version