高通公司近日宣布推出两款面向数据中心市场的AI推理芯片——AI200与AI250,同步发布基于这两款芯片的加速卡及机架级解决方案。其中AI200计划于2026年投入商用,AI250则定档2027年。这一动作标志着高通自2019年发布Cloud AI 100、2023年推出Cloud AI 100 Ultra后,第三次在数据中心AI推理领域发力。
资本市场对高通此次布局反应强烈。消息发布当日,高通股价盘中最高飙升22%至205美元,创2024年6月下旬以来新高,最终收于188美元,涨幅达11.09%。摩根大通、美银证券、TD Cowen等机构随即更新评级,维持"买入"建议并将目标价最高调至200美元。同日,高通宣布与沙特AI企业HUMAIN达成合作,双方将共同推动AI200/AI250在阿拉伯语多模态大模型(ALLaM)项目中的落地应用。
当前AI推理市场呈现爆发式增长态势。据巴克莱银行预测,到2026年AI推理计算需求将占通用人工智能总需求的70%以上,需求规模可达训练计算的4.5倍。为填补市场缺口,英伟达、谷歌、华为等企业已展开激烈竞争:9月Groq完成7.5亿美元融资计划建设全球最大推理数据中心;OpenAI与甲骨文达成5年3000亿美元采购协议;谷歌发布TPU"Ironwood"、英伟达推出"RubinCPX" GPU、华为昇腾"950PR"均聚焦推理性能提升。
高通此次推出的解决方案在技术架构上凸显差异化优势。基于NPU技术的AI200机架方案支持单卡768GB LPDDR内存,通过提升内存容量降低成本;AI250则首次采用近内存计算架构,在显著提高内存带宽的同时降低功耗。两种方案均配备直接液冷散热系统,通过PCIe纵向扩展、以太网横向扩展实现高效连接,单机架功耗达160kW。高通强调,其数据中心路线图将按年节奏推进,重点优化AI推理性能、能效比及总拥有成本(TCO)。
尽管已连续六年推出AI推理芯片,但该业务在高通整体营收中占比仍微乎其微。2025财年第三季财报显示,QCT半导体业务89.93亿美元营收主要来自手机、汽车及物联网芯片,QTL授权业务贡献13.18亿美元。此前高通曾多次尝试拓展数据中心市场:2018年服务器部门裁员50%,负责人Anand Chandrasekher离职;2024年CEO Cristiano Amon确认重返该领域;2025年宣布采用英伟达技术定制数据中心CPU,并以24亿美元收购半导体IP企业Alphawave增强竞争力。
左-HUMAIN CEO Tareq Amin;右-高通CEO Cristiano Amon
在与HUMAIN的合作中,高通将提供"全球人工智能推理服务",构建从边缘设备到云端的全栈技术体系。该项目计划将阿拉伯语大模型与高通生态深度整合,助力沙特打造全球AI中心。不过,高通管理层在财报会议中坦言,数据中心业务预计最快到2028财年才能产生实质性营收。当前公司正与超大规模云服务商洽谈合作,同时推进智慧驾驶、物联网等多元化场景落地,以应对2026年末苹果基带协议到期可能带来的营收缺口——目前苹果贡献着高通约20%的营收。












