ITBear旗下自媒体矩阵:

港科广新研究:Chimera机制助力AI大模型训练与推理“加速跑”

   时间:2025-07-16 03:24:21 来源:金羊网编辑:快讯团队 IP:北京 发表评论无障碍通道

近日,香港科技大学(广州)的研究团队在计算机体系结构领域取得了突破性进展,为提升大规模语言模型的传输速度提出了创新方案。该方案由微电子学域的博士生秦乐、崔峻伟、蔡玮林以及教授黄嘉逸共同研发,相关研究成果以论文形式在ISCA 2025国际会议上发布,并荣获Best Artifact Award。

ISCA(国际计算机体系结构研讨会)作为该领域的旗舰会议,汇聚了众多前沿研究成果,涵盖处理器设计、内存架构、互连网络等多个方面。此次获奖的论文题为“Chimera:大型语言模型中混合并行性的通信融合”,为解决大规模语言模型分布式训练和推理中的通信瓶颈问题提供了新的视角。

在大规模语言模型的运算过程中,混合并行模式被广泛应用以提高计算效率。然而,随着集群规模的扩大,设备间的数据同步通信开销逐渐成为制约系统性能的关键因素。研究团队提出的Chimera机制,通过深入分析和定义混合并行中的通信冗余,实现了相邻通信算子的融合,从而有效减少了冗余通信量。

黄嘉逸教授形象地比喻道:“就像快递分拣中心一样,以往不同区域各自为政,导致包裹反复中转,增加了不必要的流转环节。而Chimera则是对这些‘分拣中心’进行了统一规划,大幅减少了包裹的周转次数,提升了配送效率。”实验结果显示,Chimera机制能够显著提升通信速度,最高可达7倍,同时整体训练效率也提高了1.2到1.6倍。

这一创新成果不仅为AI大模型的快速训练和推理提供了新思路,也展示了香港科技大学(广州)在计算机体系结构研究领域的深厚实力和创新能力。未来,该团队将继续探索更高效的数据传输和同步机制,为人工智能领域的发展贡献更多智慧与力量。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version