华为即将在2025世界人工智能大会(WAIC)上带来一项重大展示——昇腾384超节点真机将首次线下亮相。此次盛会将于7月26日至29日举行,华为展区面积超过800平方米,涵盖60多个展点,全方位展现昇腾软硬件实力、训练推理解决方案及开源软件生态。
回顾今年5月,华为在鲲鹏昇腾开发者大会上推出了昇腾超节点技术,成功实现了业界前所未有的384卡高速总线互联壮举。这一技术突破,不仅标志着华为在人工智能领域的又一里程碑,也为行业树立了新的标杆。
传统服务器受限于以太网络,跨机互联的通信带宽较低,成为制约系统性能的关键因素。特别是在分布式策略下,当卡数超过8张时,性能瓶颈尤为明显。华为昇腾超节点技术的问世,打破了这一局限。该技术摒弃了以CPU为中心的冯诺依曼架构,创新性地提出了对等计算架构,通过高速总线互联技术,将总线从服务器内部延伸至整机柜乃至跨机柜,实现了通信带宽的显著提升。
昇腾384超节点由12个计算柜和4个总线柜组成,是目前业界规模最大的超节点。在华为ICT领域深厚的技术与工程经验支持下,该超节点通过最佳负载均衡组网方案,可进一步扩展为包含数万卡的Atlas 900 SuperCluster超节点集群,为未来更大规模的模型演进奠定了坚实基础。这一技术革新,使得集群内的设备如同单台计算机般协同工作,有效突破了系统性能的限制。
性能测试数据显示,在昇腾超节点集群上,LLaMA 3等千亿稠密模型的性能相较于传统集群提升了2.5倍以上。在多模态、MoE模型等通信需求更高的场景下,如Qwen、DeepSeek等,性能提升更是达到了3倍以上,相较于业界其他集群,性能高出1.2倍,彰显了华为在人工智能领域的领先地位。