ITBear旗下自媒体矩阵:

华为“网络+”破局模型亮相CNCC2025,为十万卡智算集群通信瓶颈破局

   时间:2025-10-26 15:02:15 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

第22届中国计算机大会在哈尔滨拉开帷幕,这场以“数智赋能,无限可能”为主题的科技盛会吸引了众多行业目光。在大会现场,华为数据通信产品线研究部部长郑晓龙发表了题为《大模型推理加速与演进:网络如何破局?》的精彩演讲,首次提出“网络+”破局模型,为十万卡智算集群面临的通信难题带来了创新性的解决方案。

郑晓龙在演讲中指出,当下单卡算力的提升速度逐渐放缓,要实现集群效率的飞跃,必须依靠网络、计算与存储的跨层协同。基于此,华为提出了“网络+”破局模型,旨在系统性地攻克超大规模集群中的通信瓶颈问题。该模型从架构设计、协议优化以及调度策略等多个维度展开,为构建下一代智算基础设施勾勒出完整的技术路线。

随着DeepSeek推动大模型架构向更稀疏的大EP部署转变,通信模式和关系发生了显著变化,呈现出随机性和非对称性的特点。为应对这一挑战,华为推出了网络级负载均衡技术。该技术能够有效应对大EP部署带来的动态通信模式难题,将通信性能提升超过20%,同时显著降低P99完成时间,为智算集群的高效运行提供了有力保障。

大模型应用的发展趋势也在不断变化,从聊天式的Chat LLM向Agentic AI演进,对token生成速度的要求从50ms大幅提升至10ms以下。然而,当前部署实践面临诸多挑战,推理阶段以小消息通信为主,控制面时延占比过高;若单纯卸载控制面,又会消耗计算资源SM。针对这些问题,华为推出了CloudMatrix384超节点及对应的超节点网络,为满足极致的TPOT需求提供了可能,助力大模型应用在新的发展阶段实现更高效运行。

在多模态LMM流量混战的大背景下,网络调度发挥着关键作用。郑晓龙强调,“网络+”并非简单的带宽升级,而是要让网络成为AI集群的“第七代算力”。华为的网络调度技术如同“四两拨千斤”,能够有效提升推理性能。最后,郑晓龙呼吁业界各方携手共建标准,与合作伙伴及行业组织共同定义大模型时代下一代智算网络接口,推动整个行业的协同发展。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version