在芯片制造技术遭遇国际限制的背景下,华为通过技术创新开辟了算力发展的新路径。近日举行的华为全球技术峰会上,华为副董事长徐直军宣布推出全球首款百万卡级算力集群及新一代超节点解决方案,标志着中国在高端算力领域实现重大突破。
据介绍,华为此次发布的Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点设备,分别可集成8192张和15488张昇腾AI芯片。这两款设备在单节点算力密度、内存带宽及节点间互联效率等核心指标上均达到全球领先水平,其中Atlas 960 SuperPoD的芯片集成量较现有同类产品提升3倍以上。基于这些超节点构建的SuperCluster集群,算力规模分别突破50万卡和百万卡级别,形成全球最强的AI算力基础设施。
技术层面,华为突破了大规模节点互联的关键瓶颈。通过自主研发的灵衢(UnifiedBus)互联协议,实现了超万卡规模集群的高效协同。该协议采用分层架构设计,将传统分布式系统的通信延迟降低60%,同时提升带宽利用率至92%以上。徐直军透露,华为将开放灵衢2.0技术规范,与产业伙伴共建开放生态,目前已有12家芯片厂商和8家服务器企业参与标准制定。
在应用场景拓展方面,华为首次将超节点技术引入通用计算领域。推出的TaiShan 950 SuperPoD通用计算超节点,配合GaussDB分布式数据库,可完全替代传统大型机和小型机系统。测试数据显示,该解决方案在金融核心交易、电信计费等关键业务场景中,处理效率较传统架构提升4-7倍,而总体拥有成本降低55%以上。
针对AI算力需求激增的现状,徐直军指出:"当前AI大模型训练所需的算力每3.4个月就翻一番,传统架构已无法满足发展需求。华为的超节点+集群方案通过硬件重构和软件优化,实现了算力密度与能效比的双重突破。"据测算,Atlas 960 SuperCluster集群在32万卡规模下,可支持万亿参数大模型的周级训练,较现有方案效率提升3倍。
值得关注的是,华为此次发布的解决方案完全基于国内可获取的芯片制造工艺。通过系统级创新,在7nm制程限制下实现了等效5nm制程的性能表现。行业分析师认为,这种"架构创新弥补制程差距"的模式,为中国科技企业突破技术封锁提供了全新范式。
目前,华为已与30余家头部企业开展超节点集群的联合测试,覆盖智能制造、智慧城市、科研计算等多个领域。某汽车厂商应用后,自动驾驶模型训练周期从90天缩短至28天,研发效率显著提升。随着灵衢生态的完善,预计到2026年将有超过200款兼容设备进入市场。