中国电信研究院联合广东电信与华为,成功完成全球首个基于多芯光纤的多智算中心分布式训练现网验证。此次验证横跨广州、深圳三地,通过中国电信广州南方基地智算中心、广州沙溪智算中心与深圳沙河智算中心互联,实现409.61公里的超长距离智算光互连,系统性能达到集中训练的97%以上,标志着跨城市大规模智算互连技术取得重大突破。
传统智算中心互联依赖单模光纤,存在带宽瓶颈与扩展性不足的问题。此次验证首次采用多芯光纤技术,通过空间维度并行传输实现带宽倍增,同时依托"中国电信云网融合技术中试验证平台"构建的全球最长多芯光纤传输系统,采用单波800Gb/s超高速光传输技术,有效解决了长距离传输中的信号衰减问题。项目团队针对现网多芯光纤各芯间性能差异、链路衰减不均等工程挑战,创新开发精细化光功率管理系统,通过动态调整各芯光功率分配,确保了跨城市复杂环境下的信号稳定传输。
该验证项目在物理层实现三大技术突破:一是构建了全球最长距离的多芯光纤智算互连系统;二是通过链路性能优化技术,将现网多芯光纤的传输效率提升至理论值的92%以上;三是开发出适用于智算业务的光电协同传输协议,实现纳秒级时延控制。这些成果为未来构建超大带宽、超高密度的智算光互连网络提供了关键技术支撑,可满足人工智能大模型训练对数据传输的严苛需求。
在平台建设方面,"中国电信云网融合技术中试验证平台"已形成完整的中试验证能力体系。该平台入选国资委央企中试平台名录后,对外开放20余项核心验证服务,涵盖光传输、网络切片、算力调度等多个领域,为下一代光网络技术从实验室到现网的转化提供了重要载体。平台配备的智能化管理系统可实时监测多芯光纤各芯传输状态,支持动态调整光路配置,显著提升了网络资源的利用率。
针对智算网络特性,项目团队升级了"光-网-算-用"全栈优化方案。通过构建光电协同、端网协同、算网协同的三层架构,开发出用户级拥塞反压机制与差异化流量控制算法,使广域分布式智算中心能够提供确定性的服务质量保障。测试数据显示,该方案在跨城传输场景下,可将大模型训练任务的同步等待时间降低60%,有效提升了分布式训练效率。











