ITBear旗下自媒体矩阵:

摩尔线程发布新架构芯片 计划打造百万卡级智算集群

   时间:2025-12-20 22:14:58 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在科创板成功上市的国产GPU企业摩尔线程,近日举办了首届MUSA开发者大会,会上不仅展示了全新GPU架构“花港”,还推出了三款基于该架构的芯片产品,引发行业广泛关注。作为国内GPU领域被视为最接近英伟达的企业,摩尔线程的产品迭代路径与英伟达颇为相似,自2022年起,每年都会发布新一代GPU架构。

回顾其发展历程,2022年摩尔线程推出了春晓架构,并同步发布了面向云计算的第一代AI智算板卡S3000;次年,曲院架构问世,对应第一代训推一体智算板卡S4000;到了2024年,平湖架构发布,同时推出了板卡S5000。此次大会上,摩尔线程再次刷新产品矩阵,不仅带来了算力密度提升50%的新架构花港,还展示了华山、庐山、长江三款芯片,分别聚焦AI训推、图形渲染和系统级芯片领域。

新架构花港在技术特性上实现了多项突破,支持从FP4到FP64的全精度计算,能够满足十万卡以上规模的智算集群扩展需求,并内置了AI生成式渲染架构。这一架构的推出,标志着摩尔线程在计算精度和集群规模上迈出了重要一步。与此同时,新一代芯片华山在计算精度上进一步优化,开始支持FP4精度计算,与英伟达当前主力芯片Blackwell的精度支持范围一致。

在算力表现方面,摩尔线程此前公开的S4000板卡数据显示,其在FP32、TF32、FP16、INT8精度下的算力分别为25 TFLOPS、49 TFLOPS、98 TFLOPS、196 TOPS,最大功耗为450W。相比之下,英伟达2020年推出的A100 80GB PCle版在相同精度下的算力分别为19.5TFLOPS、156TFLOPS、312TFLOPS、624TOPS,最大功耗为300W。尽管S4000在部分精度下的算力表现和功耗表现不及A100,但摩尔线程在技术迭代上的速度不容小觑。

关于S5000的具体性能,此次大会上摩尔线程创始人、董事长兼CEO张建中透露了更多细节。他表示,在DeepSeek-R1全量模型分布式推理场景中,S5000的Prefill Only、Decode单卡吞吐量分别达到H20等常见芯片产品的约2.5倍和1.3倍。而新一代华山芯片的浮点计算能力则介于英伟达Blackwell和Hopper之间,访存带宽与Blackwell接近,高速互联带宽则位于Hopper和Blackwell之间。

随着AI大模型训练对集群规模的需求不断提升,摩尔线程也在积极布局更大规模的智算集群。此次大会上,摩尔线程推出了万卡智算集群,并宣布了其集群规模的扩张计划。张建中表示,2024年摩尔线程已推出第一代千卡集群,今年成功扩展至1万卡,未来还将继续向10万卡、50万卡、100万卡的目标迈进。

然而,万卡智算集群的工程实现并非易事。张建中指出,超大集群的供电及液冷散热、超大规模互联组网及通信、集群训练有效算力、训练稳定性与可用性、模型训练精度与效果测评等方面均存在技术挑战。同时,大模型训练的发展趋势也要求行业在模型参数规模、训练集群规模、训练精度等方面不断突破,未来需要解决高效并行训练、低精度训练、高性能通信等一系列问题。

除了硬件产品的更新,摩尔线程此次还推出了具身智能仿真训练平台和AI算力笔记本MTT AIBOOK,进一步丰富了其产品生态。在资本市场方面,摩尔线程自科创板上市以来,股价表现波动较大。发行价为114.28元/股,12月11日收盘价曾超过900元/股,随后有所回调,12月19日收盘价为664.1元/股。尽管公司尚未实现盈利,截至今年6月底,累计未弥补亏损达16亿元,但摩尔线程预计2027年可实现合并报表盈利,不过这一前瞻性信息仍存在不确定性。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version