中科曙光(603019.SH)近日宣布,在国产高端网络技术领域取得里程碑式进展,成功推出国内首款全栈自研的400G无损高速网络解决方案——scaleFabric。该产品以原生RDMA架构为核心,实现了从底层112G SerDes高速信号传输技术、硬件设备到上层管理软件的完全自主化研发,标志着我国在数据中心高速网络领域首次打破国际技术垄断,为超大规模人工智能计算集群提供了关键基础设施支撑。
作为面向下一代智算场景设计的创新产品,scaleFabric构建了完整的自主技术生态链。其研发团队攻克了核心IP设计、交换芯片架构、智能网卡开发等关键技术难题,形成涵盖网卡、交换机、驱动软件及集群管理系统的全链条解决方案。这种从硬件到软件的垂直整合能力,使系统性能优化不再受制于国外技术标准,为国内AI企业构建自主可控的计算网络提供了全新选择。
在性能指标方面,scaleFabric400系列展现出强劲的竞争力。其智能网卡采用PCIe5.0高速接口,单端口带宽突破400Gbps,端到端通信延迟控制在0.9微秒以内;配套交换机产品单端口带宽达800Gbps,整机交换容量高达双向64Tbps,交换延迟仅260纳秒。经实测验证,该网络架构可完美支撑万卡级AI训练集群的并发计算需求,在带宽利用率和时延稳定性等关键指标上达到国际领先水平。
针对大规模集群运行的稳定性挑战,研发团队创新性地采用信用制无损流量控制机制,从协议层面消除网络拥塞导致的丢包风险。测试数据显示,系统可在1毫秒内完成链路故障自动恢复,近万卡规模集群已持续稳定运行超过10个月。相比国际同类产品,scaleFabric的交换机端口密度提升25%,网卡并发连接数增加100%,单子网互连规模扩展至传统IB网络的2.33倍,最大可支持11.4万卡规模的超大型集群部署。
成本优势成为该产品的另一大亮点。通过架构优化和自主技术替代,scaleFabric在保持性能领先的同时,将网络建设总成本降低30%。这种"性能不减、成本更优"的特性,特别适用于需要大规模扩展计算资源的AI训练场景,为国内企业构建自主可控的智算基础设施提供了更具性价比的解决方案。目前,该产品已进入多家头部AI企业的测试验证阶段,预计将在年内实现规模化商用部署。











