华为在近日举办的中国合作伙伴大会上,正式推出并展示了基于全新昇腾950PR处理器的AI训练推理加速卡Atlas 350,宣布该产品即日起进入市场销售。这款加速卡凭借其强大的算力性能和低精度数据支持能力,成为国内AI计算领域的重要突破。
昇腾950PR芯片采用SIMD架构设计,在算力表现上达到1PFLOPS(FP8)和2PFLOPS(FP4),支持包括FP32、HF32、FP16在内的九种数据格式。芯片互联带宽达2TB/s,配备128GB内存容量和1.6TB/s带宽,在低精度计算、向量处理能力和内存访问效率等关键指标上实现显著提升。与英伟达H20相比,其HBM容量提升至112GB,多模态生成速度提高60%,内存访问颗粒度优化至128字节,使小算子处理效率提升四倍。
Atlas 350加速卡在硬件参数上表现突出,FP4精度算力达1.56P,带宽1.4TB/s,功耗控制在600W水平。华为昇腾计算业务负责人指出,该产品单卡算力是英伟达H20的2.87倍,作为国内首款支持FP4低精度推理的解决方案,可显著提升服务器对大模型的支持能力和推理响应速度。实际测试数据显示,在互联网推荐场景中,该加速卡在时延控制和并发处理方面表现优异,特别适用于短视频推荐、电商广告等高流量业务场景,其多模态处理能力已达到英伟达L20同等水平。
基于Atlas 350的服务器生态系统建设取得实质性进展。昆仑、华鲲振宇等七家核心合作伙伴同步推出搭载该加速卡的整机产品,标志着昇腾950代际推理算力正式进入商用阶段。其中软通动力发布的"超强A860 A5"服务器采用6U2路架构,可支持8块Atlas 350加速卡,具备超强算力与灵活扩展特性,适用于AI大模型训练、视频分析等重负载场景。科大讯飞宣布其新一代星火大模型将与昇腾910/950系列算力底座深度适配,提供覆盖行业需求的智能化解决方案。
在行业应用层面,华为联合20家头部企业推出覆盖政务、医疗、客服等领域的AI场景化解决方案。这些方案具有轻量化部署、快速落地和可复制推广的特点,有效解决传统智能化改造周期长、实施复杂等痛点。针对近期兴起的AI一体机市场需求,华为透露已有十余家合作伙伴推出基于昇腾架构的OpenClaw一体机产品。目前昇腾生态已联合打造400余款行业一体机,服务客户超过2700家,在国内一体机市场占据主导地位。







