英伟达在即将于本月24日至26日举行的Hot Chips大会上,正式宣布推出NVIDIA Spectrum-XGS Ethernet技术,该技术即时起成为NVIDIA Spectrum-X以太网平台的重要组成部分。这项技术专为分布式数据中心设计,旨在将分散于各地的独立数据中心连接起来,构建一个计算能力达到千亿级别的AI超级工厂。
据英伟达官方介绍,随着AI需求的急剧增长,单个数据中心在电力供应和计算能力上正逐渐逼近极限。传统的以太网技术在延迟、抖动以及性能一致性方面存在局限性,使得数据中心难以跨越单个设施的边界进行扩展。Spectrum-XGS Ethernet技术正是为了解决这一问题而诞生的,它引入了跨域扩展架构,并配备了自适应网络算法,能够根据数据中心之间的距离进行动态调整,从而优化网络连接。
Spectrum-XGS Ethernet技术的核心特点包括自适应距离拥塞控制、精准延迟管理以及端到端遥测系统。自适应距离拥塞控制能够动态优化数据中心间的网络传输,确保数据传输的流畅性;精准延迟管理则显著提升了NCCL通信库的性能,几乎实现了一倍的增长;而端到端遥测系统则保障了地理分散集群的可预测性能,使得整个AI超级工厂的运行更加稳定可靠。
英伟达创始人兼首席执行官黄仁勋表示:“AI产业革命已经全面展开,而超大规模的AI工厂正是推动这一革命的关键基础设施。通过Spectrum-XGS Ethernet技术,我们在纵向扩展和横向扩展的基础上,增加了跨域扩展的能力,将分布在全球各地的数据中心连接成一个庞大的千亿级AI超级工厂,为AI的发展提供了强大的支持。”
云服务商CoreWeave已经率先采用了Spectrum-XGS Ethernet技术。CoreWeave的联合创始人兼首席技术官Peter Salanki表示:“这项技术将我们的数据中心整合为一个统一的超级计算机,极大地提升了我们的计算能力和运营效率。”
在此之前,英伟达已经推出了Spectrum-X交换机和ConnectX-8 SuperNIC,这些产品能够跨站点连接数百万个GPU,同时降低能耗和运营成本。而Spectrum-XGS Ethernet技术的推出,将进一步巩固英伟达在数据中心连接技术领域的领先地位。