滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek开源LPLB负载均衡器：线性规划助力，破解MoE训练动态失衡难题

时间：2025-11-20 10:53:29 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域迎来新突破，DeepSeek在GitHub平台开源了一款名为LPLB（Linear-Programming-Based Load Balancer）的并行负载均衡器。这款基于线性规划技术的工具，专门针对混合专家（MoE）模型的专家并行工作负载分配进行优化，其设计理念与英伟达在万卡GPU集群中的调度机制存在异曲同工之妙。

据技术文档披露，LPLB的核心创新在于将调度层级从计算单元（SM）提升至整个处理流水线。英伟达此前通过NVLink连接的GPU集群中，采用类似机制为不同内核分配计算资源，而DeepSeek的解决方案通过抽象化处理，实现了更宏观的负载调控。目前该项目仍处于早期研发阶段，具体性能提升幅度尚在持续评估中。

该工具通过三重机制实现动态均衡：首先利用嵌入的EPLB模块对专家进行工作负载统计驱动的动态重排序；其次构建考虑硬件拓扑结构的专家副本体系；最后针对每个训练批次求解最优Token分配方案。其内置的线性规划求解器采用单SM内点法，并调用NVIDIA的cuSolverDx和cuBLASDx库进行矩阵运算，工作负载数据可通过用户输入、torch.distributed框架或Deep-EP内部通信器获取。

作为EPLB的升级版本，LPLB重点解决MoE训练中的动态失衡问题。EPLB主要处理数据分布导致的静态不均衡现象，而LPLB则针对小批次训练中出现的随机波动。具体实现上，系统为每个原始专家配置冗余专家，在GPU间形成传输通道，通过求解线性规划问题重新分配Token流，在通道容量限制下最小化组内负载差异。为降低通信开销，系统采用NVLINK和NVSHMEM技术替代传统torch.distributed.allreduce方法。

开发团队设计了多种硬件拓扑支持方案。Cube模式在8GPU子组内构建立方体图结构，要求每个GPU至少承载2个专家；Hypercube模式扩展至16GPU规模，通过移除对角边优化跨节点通信；Torus模式则在节点内外GPU间复制专家形成环面结构，适用于全局均衡但节点内通信效率略逊于Cube模式。用户可通过修改r2o矩阵自定义拓扑结构。

技术文档同时指出当前存在的三大局限：成本估算模型未考虑矩阵乘法的非线性时间成本，可能导致次优调度；求解器在节点内优化耗时约100微秒，对小批次任务影响显著；极端负载不均衡场景下，因避免多副本分配给同一原始专家的限制，性能可能弱于EPLB方案。

对于部署环境，系统要求CUDA工具包版本不低于12.6.3，强烈建议搭配DeepEP框架使用。安装流程包含数学库下载、环境变量配置和pip安装三个步骤，并提供详细的拓扑定义接口示例。开发者可通过GitHub仓库（https://github.com/deepseek-ai/LPLB）获取完整代码和文档，示例代码展示了如何配置冗余专家拓扑并执行负载重定向操作。

更多>同类资讯

孟晚舟新年致辞：华为聚焦七大方向，以奋斗者精神开启新征程

华为要从“技术巨头”变身为“产业赋能者”，这条路并不好走：既要平衡好战略聚焦和行业需求分散的矛盾，也要解决生态建设和商业价值匹配的问题，还要应对同时外部的各种不确定性。孟晚舟的这次新年致辞，很务实，本质也是…

01-02

DeepSeek新年送“贺礼”：mHC架构或为大模型演进指明新方向

01-02

2026：人形机器人从“景观”迈向“基建” 奇点时刻渐近？

01-02

OpenAI强化音频AI能力布局无屏设备欲打造“伴随式助手”新生态

01-02

人工智能热潮下闪迪股价狂飙559%，数据中心万亿投资催生存储新机遇

01-02

2025长城汽车：以文化为翼，驭技术之舟，驶向全球新征程

01-02

DeepSeek梁文锋领衔！2026开年发布mHC架构破解大模型训练难题

01-02

2026年MQTT协议：技术升级、AI融合引领AIoT时代新发展

2026 年，MQTT 协议将成为 AI 与 IoT 融合发展的核心枢纽，围绕协议升级、AI协同、部署模式革新及跨域集成四大方向全面演进，进一步夯实其在物联网通信领域的核心地位。 2026 年，MQTT 协…

01-02

AI算力需求扩张：半导体或迈入万亿美元纪元

01-01

刚刚！DeepSeek梁文峰发表新论文

01-01

新网络安全法今起实施：聚焦AI安全，罚款上限升至千万促规范发展

01-01

2026年初独家探秘！籽岷携手馆长抢先揭秘上海科技馆焕新模样

01-01

DeepSeek新年献礼！梁文锋领衔论文，mHC方案为大模型训练带来新突破

01-01

IICIE国际集成电路创新博览会：跨界融合，共绘全链生态新蓝图

01-01

DeepSeek发布mHC新架构与多款模型科研突破与产品创新引领AI新方向

01-01

点击查看更多 +

全站最新

一汽丰田bZ3智享家焕新登场，新增配置升级，售价亲民引关注

蓝色光标拟赴港上市：2025年前9个月营收净利双增业绩向好

新款传祺M8 30.99万起售，配置有增有减，购车需细考量

新款Macan逐梦版：胭脂红惊艳亮相，标配满配直击国人用车痛点

广汽丰田铂智7：大空间高智能，20万级纯电轿车的优选之选

小米汽车成绩亮眼！月交付破5万，入门纯电SU3渲染图引热议

热门内容

本栏最新

2025长城汽车：以文化为翼，驭技术之舟，驶向全球新征程

中东面孔亮相发布会，极石汽车携海外经验强势布局国内市场

一汽丰田bZ3焕新上市，激光雷达+Momenta 5.0，9.38万起售竞争力强

一汽丰田bZ3焕新上市！9.38万起配激光雷达，智驾升级成亮点

Manus季逸超：AI创业成本结构特殊，精细化经营能力成关键

新款卡罗拉焕新登场，设计智能空间升级，9.90万起能否再掀热潮？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.