ITBear旗下自媒体矩阵:

华为徐直军:未来3年昇腾芯片将快速演进,2027年超节点集群规模达百万卡级

   时间:2025-09-19 04:19:01 来源:中国基金报编辑:快讯团队 IP:北京 发表评论无障碍通道
 

华为轮值董事长徐直军在近日举行的行业峰会上宣布,昇腾芯片未来三年将进入高速迭代期,通过技术突破持续推动人工智能算力跃升。根据规划,华为将推出Ascend 950、960、970三大系列芯片,实现算力每年翻倍增长,同时构建超大规模算力集群,支撑从千亿参数到十万亿参数模型的训练需求。

徐直军指出,尽管部分技术路径降低了算力消耗,但迈向通用人工智能(AGI)和物理世界人工智能(物理AI)仍需算力作为核心支撑。华为此次规划的昇腾芯片路线图显示,Ascend 950系列已进入量产阶段,该系列包含950PR和950DT两颗芯片,采用统一架构设计,通过引入FP8/MXFP8等低精度计算格式,将算力提升至1P到2P区间,同时支持自研HiF8格式,在保持接近FP16精度的前提下显著提升能效。

技术升级方面,Ascend 950系列实现了四大突破:向量计算单元占比大幅提升,通过双编程模型新同构设计优化计算效率;内存访问颗粒度精细化,降低数据搬运开销;互联带宽达2TB/s,较前代提升2.5倍;集成自研HiBL1.0和HiZQ 2.0两种高带宽内存,与芯片核心直接封装。这些改进使单芯片性能较前代提升数倍,特别在向量计算和内存带宽等关键指标上形成代际优势。

按照规划,2027年第四季度将推出Ascend 960芯片,该产品在算力密度、内存带宽等核心参数上实现全面翻倍,并首次支持自研HiF4数据格式。徐直军强调,HiF4在4bit精度下可提供优于业界FP4方案的推理精度,同时将推理吞吐量提升30%以上。正在研发中的Ascend 970芯片则计划在FP4/FP8算力、互联带宽等指标上再翻一番,内存访问带宽增幅不低于1.5倍。

基于新一代芯片,华为同步构建了超节点与集群产品体系。现场发布的Atlas 950超节点采用灵衢2.0互联协议,通过总线级互联架构实现万卡级设备协同,逻辑上作为单一计算单元运行。该架构解决了长距离电互联的可靠性问题,同时将互联时延压缩至纳秒级。徐直军透露,基于灵衢1.0的Atlas 900系统已在全球部署超300套,2.0版本在带宽和时延指标上实现代际优化。

在集群产品领域,华为推出的Atlas 950 SuperCluster以2.5倍于xAI Colossus的规模和1.3倍的算力,成为全球最大规模的单体算力集群。该系统可稳定支持千亿至十万亿参数模型的训练任务,特别在稀疏化大模型训练中展现出显著优势。2027年底,基于Atlas 960超节点的百万卡级集群将投入商用,其计算密度和能效比预计将再创新高。

为推动产业生态发展,华为宣布开放灵衢2.0技术规范,欢迎合作伙伴基于该协议开发兼容设备。徐直军表示,通过标准化互联接口和协同协议,可降低超节点系统的构建门槛,加速AI基础设施的规模化部署。目前,灵衢协议已形成涵盖芯片、服务器、网络设备的完整技术体系,为构建开放算力生态奠定基础。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version