ITBear旗下自媒体矩阵:

摩尔线程发布"花港"架构及"华山"GPU,十万卡集群性能表现亮眼

   时间:2025-12-20 17:15:09 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在首届MUSA开发者大会上,摩尔线程宣布推出全新GPU架构“花港”,并同步发布首款基于该架构的云端AI加速芯片“华山”。这款芯片专为超大规模AI计算场景设计,可支持十万卡级集群部署,片间互联速率突破1314GB/s,通过新一代Scale-up系统实现多协议兼容,包括MTLink 4.0及主流以太网标准,适配多种高速交换设备并支持SHARP网络优化技术。

技术参数显示,基于“华山”芯片构建的KUAE万卡集群浮点运算能力达10 Exa-FLOPS,在主流精度模型训练中表现优于国际同类产品,大模型训练效率指标MFU达到60%。集群稳定性方面实现显著突破,有效训练时长占比提升至90%,零中断技术理论可靠性达99%,万卡规模下训练线性度保持95%以上,综合性价比达到H20芯片的1.5倍。

分布式推理性能测试中,采用MTT S5000芯片的PD分离架构集群展现突出优势。在DeepSeek R1全量模型测试中,Prefill Only场景下单卡吞吐量达到H20的2.5倍,Decode场景下仍保持1.3倍的性能领先。该架构通过优化数据流处理机制,显著提升了大规模并行计算场景下的资源利用率。

此次发布的“花港”架构采用模块化设计理念,支持从边缘计算到数据中心的多场景覆盖。新一代互联技术突破传统拓扑限制,通过动态带宽分配算法实现计算资源的高效协同。摩尔线程研发团队表示,该架构在能效比优化方面取得关键进展,单位功耗下的计算密度较前代产品提升40%,为AI大模型训练提供更经济的解决方案。

行业分析师指出,随着AI模型参数规模突破万亿级,对计算集群的扩展性和稳定性提出更高要求。摩尔线程此次推出的全栈解决方案,在硬件架构、互联协议、集群管理三个维度形成技术闭环,其万卡级部署能力将直接推动自动驾驶、药物研发等超大规模计算领域的发展进程。目前该系列产品已进入量产阶段,首批客户涵盖云计算服务商和科研机构。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version