第22届中国计算机大会在哈尔滨拉开帷幕,这场以“数智赋能,无限可能”为主题的科技盛会吸引了众多行业目光。在大会现场,华为数据通信产品线研究部部长郑晓龙发表了题为《大模型推理加速与演进:网络如何破局?》的精彩演讲,首次提出“网络+”破局模型,为十万卡智算集群面临的通信难题带来了创新性的解决方案。
郑晓龙在演讲中指出,当下单卡算力的提升速度逐渐放缓,要实现集群效率的飞跃,必须依靠网络、计算与存储的跨层协同。基于此,华为提出了“网络+”破局模型,旨在系统性地攻克超大规模集群中的通信瓶颈问题。该模型从架构设计、协议优化以及调度策略等多个维度展开,为构建下一代智算基础设施勾勒出完整的技术路线。
随着DeepSeek推动大模型架构向更稀疏的大EP部署转变,通信模式和关系发生了显著变化,呈现出随机性和非对称性的特点。为应对这一挑战,华为推出了网络级负载均衡技术。该技术能够有效应对大EP部署带来的动态通信模式难题,将通信性能提升超过20%,同时显著降低P99完成时间,为智算集群的高效运行提供了有力保障。
大模型应用的发展趋势也在不断变化,从聊天式的Chat LLM向Agentic AI演进,对token生成速度的要求从50ms大幅提升至10ms以下。然而,当前部署实践面临诸多挑战,推理阶段以小消息通信为主,控制面时延占比过高;若单纯卸载控制面,又会消耗计算资源SM。针对这些问题,华为推出了CloudMatrix384超节点及对应的超节点网络,为满足极致的TPOT需求提供了可能,助力大模型应用在新的发展阶段实现更高效运行。
在多模态LMM流量混战的大背景下,网络调度发挥着关键作用。郑晓龙强调,“网络+”并非简单的带宽升级,而是要让网络成为AI集群的“第七代算力”。华为的网络调度技术如同“四两拨千斤”,能够有效提升推理性能。最后,郑晓龙呼吁业界各方携手共建标准,与合作伙伴及行业组织共同定义大模型时代下一代智算网络接口,推动整个行业的协同发展。











