ITBear旗下自媒体矩阵:

摩尔线程“AI工厂”:重塑AI训练生态,引领千行百业智能升级

   时间:2025-07-28 05:39:26 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在世界人工智能大会即将拉开帷幕之际,国产芯片产业的目光聚焦于摩尔线程所打造的“AI工厂”。这一创新成果在2025年成为了行业内热议的话题。

摩尔线程的创始人兼首席执行官张建中,在一场以“算力进化,精度革命”为主题的技术分享会上,详细阐述了公司如何应对生成式AI的迅猛增长所带来的大模型训练效率瓶颈。他介绍,摩尔线程通过系统性的工程创新,构建了一个面向AI训练的新时代基础设施,旨在AGI(通用人工智能)时代打造一座能够高效生产先进模型的“超级工厂”。

摩尔线程的“AI工厂”概念,类似于芯片晶圆厂的制程升级,它不仅是一次技术上的革新,更是一场全方位的系统性变革。这包括从底层芯片架构的创新,到集群整体架构的优化,再到软件算法和资源调度系统的全面升级。这一系列变革将推动AI训练规模从千卡级跃升至万卡级,乃至十万卡级,从而实现生产力和创新效率的显著提升。

“AI工厂”的生产效率由五大核心要素共同决定,即加速计算的通用性、单芯片的有效算力、单节点的效率、集群的效率以及集群的稳定性。摩尔线程以全功能GPU的通用算力为基础,通过一系列深度技术创新,将这些要素协同提升,从而转化为工程级的训练效率和可靠性保障。

摩尔线程通过软硬深度协同的系统级创新,构建了“AI工厂”的五大核心技术支柱,旨在实现大模型训练效率的质的飞跃。首先,他们以自主研发的全功能GPU为核心,构建了兼具功能完备性和精度完整性的通用性底座,全面满足从AI训练、推理到科学计算的全场景需求。

基于突破性的MUSA架构,摩尔线程的GPU单芯片集成了AI计算加速、图形渲染、物理仿真及超高清视频编解码能力,完美适配多样化的应用场景。在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在前沿大模型训练中实现了20%-30%的性能提升。

芯片的有效算力是驱动“AI工厂”高效运转的关键。摩尔线程通过自研的MUSA架构,在计算、内存、通信方面取得了三重突破,显著提升了单GPU的运算效率。他们采用创新的多引擎、可伸缩GPU架构,构建了全局共享的计算、内存与通信资源池,不仅突破了传统GPU的限制,还大幅提升了资源利用率。

在计算层面,摩尔线程的AI加速系统支持多种混合精度计算。作为国内首批实现FP8算力量产的GPU厂商,其FP8技术通过一系列创新设计,在保证计算精度的同时,将Transformer计算性能提升了约30%。在内存系统方面,他们通过多项技术实现了带宽节省和延迟降低。在通信和互联领域,独创的ACE异步通信引擎和MTLink2.0互联技术为大规模集群部署奠定了坚实基础。

摩尔线程通过MUSA全栈系统软件实现了关键技术突破,推动“AI工厂”从单点创新转向系统级效能提升。他们自研的KUAE计算集群通过5D大规模分布式并行计算技术,实现了上千节点的高效协作,显著提升了大规模集群的训练效率。同时,他们还创新推出了零中断容错技术,确保在硬件故障发生时,训练过程能够无缝继续,大幅降低了恢复开销。

摩尔线程凭借全功能GPU的通用计算能力、创新的MUSA架构、优化的MUSA软件栈、自研的KUAE集群以及零中断容错技术,成功构建起高效的“AI工厂”。这一完善的“AI工厂”不仅具备高效训练大模型的能力,还拥有推理验证能力,实现了“训练-验证-部署”的无缝衔接。

摩尔线程的全功能GPU正在持续加速计算领域的革新,以“KUAE+MUSA”为核心,他们将加速推动AI技术在多个关键领域的应用与部署,包括物理仿真、AIGC、科学计算、具身智能、医疗影像分析、工业大模型等。摩尔线程还计划于今年10月举办首届MUSA开发者大会,邀请全球开发者共同探讨前沿技术,共享MUSA自主新生态。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version