ITBear旗下自媒体矩阵:

摩尔线程开发者大会:花港架构发布,全功能GPU潜力加速释放

   时间:2025-12-26 10:52:24 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

寒意未散的北京,摩尔线程首届开发者大会现场却热度非凡。一千平方米的展区内,上千名开发者穿梭于各个展台之间,智能机器人、数字人、AI for Science等前沿领域的技术展示令人目不暇接,气象预测等尖端应用案例更引发阵阵讨论。

展区中央的数字文娱与视频多媒体展台成为焦点。一位工程师操控着eVTOL全动飞行模拟器,沉浸在逼真的飞行体验中;另一侧,国产GPU驱动的经典拳皇游戏与3A大作同时运行,流畅的画面与细腻的渲染效果引得围观者赞叹。“目前国内能展示街霸游戏的,可能只有我们。”这位工程师自豪地指出,摩尔线程在图形处理能力上的稀缺性正源于其全功能GPU的独特定位。

全功能GPU的价值在展区内得到多维呈现。十个应用案例的集中展示已足够震撼,而当近百个案例同时铺开时,其冲击力更令人惊叹——这些覆盖消费级到行业级、图形处理到AI计算的场景,全部来自一家成立仅五年的国产GPU公司。从游戏渲染到医疗影像重建,从工业设计到气象模拟,摩尔线程用实际成果诠释了全功能GPU的“奥义”:通过单一架构实现多领域覆盖,打破传统GPU的功能边界。

中国工程院院士、清华大学教授郑纬民在会上强调,真正的GPU必须同时具备三大核心能力:完整的图形流水线、支持AI的张量计算核心,以及满足高性能计算需求的高精度浮点单元。摩尔线程创始人张建中进一步解释,其全功能GPU内置AI计算、3D图形渲染、物理仿真与科学计算、超高清视频编解码等多种引擎,实现了“AI+3D图形+高性能计算”的融合。这种技术路线在大会上得到全面验证——新一代全功能GPU架构“花港”及基于该架构的AI训推一体芯片“华山”、专业图形计算芯片“庐山”等新品正式发布,标志着国产芯片性能迈入新阶段。

展区内的近百个应用案例,生动展现了全功能GPU的落地能力。在图形渲染领域,摩尔线程自2022年发布消费级显卡MTT S80以来,通过每月一次的驱动更新,已实现对国内Top 50热门游戏的100%兼容,并对其中44款完成专项优化。其端侧实时视频超分技术MTVSR可实现2-4倍实时超分,显著降低视频存储与传输成本;基于MTT X300的国产视景系统更通过中国民航局5级鉴定,打通了全国产化视景渲染链路。在医疗场景中,锦瑟医疗的篝火云平台整合AI推理、三维重建与高性能渲染,将二维医学影像实时转化为三维模型,为手术提供精准导航;工业领域,景业智能的VR遥操作机器人系统与MTT E300 AI模组适配,操作者通过VR眼镜即可在高风险环境中完成精细作业。

AI计算与高性能计算场景同样亮点纷呈。摩尔线程通过KUAE集群的零中断容错方案,实现大规模训练全程稳定运行;与硅基流动合作优化的MTT S5000,在DeepSeek 671B全量模型推理中,单卡Prefill吞吐突破4000 tokens/s,Decode吞吐突破1000 tokens/s,刷新国产推理性能标杆。科学计算方面,摩尔线程联合北京大学打造的软硬件协同生命科学解决方案,以及硒钼科技适配MTT S4000的AI for Science平台,均展现了全功能GPU在跨学科领域的潜力。天思智慧、联达兴等合作伙伴基于摩尔线程GPU推出的AI Box,已将算力延伸至具身智能、制造、交通、教育等十余个行业。

性能突破的背后,是摩尔线程在架构迭代上的持续投入。自2022年量产第一代架构“苏堤”以来,公司以每年一代的速度推进技术升级:2023年发布“春晓”架构,2024年量产“曲院”架构,2025年推出“平湖”架构。每代架构均针对不同市场需求推出定制化产品,如满足信创PC需求的S10、服务云桌面的S3000、支撑千卡集群的S4000,以及构建万卡集群的S5000。2026年,基于全新指令集的“花港”架构将正式登场,通过算力密度提升50%、效能提升10倍的技术目标,为国产芯片性能打开新上限。

“花港”架构的优化方向涵盖多个维度:计算精度上,全精度端到端技术特别优化FP8、FP6、FP4等低精度单元;扩展能力方面,支持十万卡以上计算集群,异步编程模型提升整体利用率;图形渲染领域,新一代AI生成式渲染架构(AGR)与第二代光线追踪加速引擎将渲染速度提升5-6倍;安全性则通过四层防护体系全方位守护数据。基于该架构的“华山”芯片在浮点计算性能上比肩国际领先产品,其开放支持多种以太协议的特性,更解决了硬件生态兼容难题;“庐山”芯片则在游戏性能、AI计算、几何处理、光线追踪等指标上实现数倍至数十倍提升,可胜任3A游戏、CAD、CAE等复杂场景。

技术突破需生态支撑,摩尔线程自主研发的元计算统一系统架构MUSA,成为连接开发者与硬件的核心桥梁。MUSA 5.0在全栈统一性、极致效能与生态开放性上取得关键进展:编程生态方面,原生MUSA C深度兼容TileLang、Triton等语言;计算效能上,核心计算库muDNN实现GEMM/FlashAttention效率超98%,编译器性能提升3倍;开源生态持续扩大,未来将逐步开放计算加速库、通信库等核心组件;前沿特性拓展中,兼容跨代GPU指令的中间语言MTX、面向渲染+AI融合的muLang编程语言等工具,将持续拓展算力边界。

为降低开发者门槛,摩尔线程推出搭载新一代长江AI SoC的AIBOOK开发平台。该设备集成CPU、GPU、NPU等七大计算单元,提供50TOPS端侧AI算力,预装Linux内核AIOS系统及开发工具,支持主流操作系统,实现“开箱即用”。同步推出的迷你型计算设备MTT AICube与端云一体化具身智能方案MT Robot,则为开发者提供更多硬件选择与完整解决方案。目前,摩尔学院用户总量已突破20万,公司目标直指百万级MUSA开发者生态——这一数字的背后,是全功能GPU应用广度与生态厚度的双重积淀,也是支撑其千亿市场价值的核心逻辑。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version