在华为中国合作伙伴大会上,一款搭载全新昇腾950PR处理器的AI训练推理加速卡Atlas 350正式亮相并宣布上市。这款加速卡基于SIMD架构设计,算力表现尤为突出,FP8精度下可达1PFLOPS,FP4精度下则提升至2PFLOPS,同时支持多种数据格式,互联带宽高达2TB/s,内存容量与带宽分别达到128GB和1.6TB/s。
与前代产品相比,昇腾950PR在低精度数据格式处理、向量算力、互联带宽以及自研HBM技术等方面均有显著提升。相较于英伟达H20芯片,其HBM容量增加16%,达到112GB,多模态生成速度提升60%,内存访问颗粒度优化至128字节,小算子访存效率提高4倍。这些改进使得Atlas 350在处理复杂AI任务时更具优势。
具体到Atlas 350加速卡的硬件参数,FP4精度算力为1.56P,带宽达1.4TB/s,功耗控制在600W。尽管功耗是H20的1.5倍,但其单卡算力却达到H20的2.87倍,成为国内首款支持FP4低精度的推理产品。这一特性使得集成Atlas 350的服务器能够支持更大规模的模型,同时实现更低的推理时延和更高的寄存器效率。
实际应用测试显示,Atlas 350在互联网推荐场景中表现优异,时延更低、响应更快,特别适合短视频、电商、广告推荐等高并发场景。在大模型推理、文生图、文生视频等多模态任务中,其性能与英伟达L20相当,展现出强大的竞争力。
华为昇腾计算业务负责人表示,基于Atlas 350等产品,昇腾将构建大、中、小三大核心算力场景,以满足不同行业客户的差异化需求,推动行业智能化进程。大会期间,昆仑、华鲲振宇等七家华为核心合作伙伴发布了基于Atlas 350的服务器整机产品,标志着昇腾950代际推理算力正式进入商用阶段。
其中,软通动力推出的“超强A860 A5”AI服务器备受关注。这款6U2路服务器搭载鲲鹏920处理器,可支持8块Atlas 350加速卡,具备超强算力、灵活扩展和安全可靠等特点,适用于AI大语言模型训练、视频分析等场景。科大讯飞也宣布,其新一代星火大模型将与昇腾910/950系列算力底座深度适配,为用户提供更智能的解决方案。
华为还联合20家行业头部伙伴发布了2026昇腾AI应用场景解决方案,覆盖辅助办公、电子病历、智能客服等多个核心领域。这些方案以轻量部署、快速落地和可规模复制为特点,旨在解决行业智能化部署复杂、周期长的难题。
近期,基于OpenClaw的AI应用需求激增,推动了相关一体机市场的发展。华为透露,过去一个月已有十几家合作伙伴推出基于昇腾的OpenClaw一体机。截至目前,昇腾已联合伙伴打造400多款行业一体机,服务客户超过2700家,占据国内一体机市场八成以上份额。







