在上市仅半个月后,国产GPU厂商摩尔线程以一场盛大的开发者大会,向行业展示了其技术创新的最新成果。公司创始人兼CEO张建中在MUSA开发者大会上宣布,推出新一代全功能GPU架构“花港”,并同步发布基于该架构的两款芯片——“华山”与“庐山”,以及智能SoC芯片“长江”和夸娥万卡智算集群,标志着其在AI计算与图形渲染领域迈入新阶段。
“花港”架构成为全场焦点。据介绍,该架构采用新一代指令集,支持从FP4到FP64的全精度计算,算力密度较上一代提升50%,能效比提升10倍,并具备支持十万卡级智算集群的能力。张建中透露,基于“花港”架构的“华山”芯片专为AI训练与推理设计,集成全精度张量计算单元,可覆盖从低精度到高精度的全场景需求;而“庐山”芯片则聚焦图形渲染,其AI计算性能较前代提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,同时在显存容量与数据传输效率上实现突破。
在智算领域,摩尔线程发布的夸娥万卡集群引发关注。该集群浮点运算能力达10Exa-Flops,在Dense大模型训练中算力利用率达60%,MOE大模型达40%,训练线性扩展效率高达95%。张建中强调,摩尔线程已实现从千卡到万卡的跨越,并计划向十万卡、百万卡规模进军。实测数据显示,采用FP8精度训练主流大模型时,其训练损失曲线与国际主流显卡基本一致,且在相同数据量下效果更优。
端侧算力产品同样成为亮点。搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,提供50TOPS的端侧AI算力,支持多系统切换,包括Linux、Windows虚拟机、Android容器及国产操作系统,旨在为开发者提供一站式开发环境。张建中表示,这款设备集开发、娱乐、办公功能于一体,是连接开发者与MUSA生态的重要入口。
生态建设被摩尔线程视为核心战略。中国工程院院士郑纬民在会上指出,开发者是生态构建的关键,国产芯片需提供友好易用的开发环境。摩尔线程宣布成立MUSA生态中心,并启动开发者计划,其在线学习平台摩尔学院已吸引近20万开发者。为降低迁移成本,公司推出自动化工具,可将CUDA代码转换为MUSA代码,目前编译率达93%,准确率超90%,同时通过算子适配减少调试时间。
多家企业现场分享了与摩尔线程的合作经验。一家工业机器人企业研发人员表示,初期适配时虽面临接口差异问题,但通过双方协作已全部解决,强调“硬件支持需快速落地,接口适配是后续功能开发的基础”。另一家初创企业则看重摩尔线程全功能GPU的性价比优势,认为其生态定位能吸引跨行业合作伙伴,满足现阶段开发需求。
全链国产化趋势下,摩尔线程的兼容性优势进一步凸显。尚阳科技董事长李向阳提到,公司基于MUSA生态打造的企业级智能体引擎,得益于摩尔线程GPU的图形与计算一体化能力,部分性能可对标英伟达产品。他特别指出,MUSA框架对CUDA的深度兼容是核心优势,显著降低了开发者迁移门槛,目前最关注生态在细节功能适配上的持续完善。









