高通于近日正式推出AI200与AI250两款专为数据中心设计的AI推理芯片,同步发布基于这两款芯片的加速卡及机架级解决方案。根据规划,AI200将于2026年投入商用,AI250则定于2027年进入市场。这是高通继2019年Cloud AI 100、2023年Cloud AI 100 Ultra之后,在数据中心AI推理领域的第三次重要布局。
资本市场对这一动作反应热烈。新品发布当日,高通股价盘中一度飙升22%至205美元,创下2024年6月下旬以来的最高纪录,最终以188美元收盘,涨幅达11.09%。摩根大通、美银证券、TD Cowen等多家投行随即更新评级,维持“买入”建议,部分机构将目标价上调至200美元。
同日,高通宣布与沙特阿拉伯AI企业HUMAIN达成战略合作,双方将共同推动AI200与AI250的落地应用。HUMAIN正在开发阿拉伯语多模态大语言模型,计划与高通边缘设备生态深度整合,构建从芯片到应用的完整技术链条。高通将为该项目提供“全球人工智能推理服务”,助力沙特打造全球首个边缘到云混合AI中心。
随着AI应用场景的爆发式增长,市场对推理芯片的需求持续攀升。今年以来,英伟达、谷歌、华为等科技巨头均已推出相关新品。例如,英伟达9月发布的RubinCPX GPU专注于AI视频生成与上下文处理,计划2026年底上市;华为同月推出的昇腾950PR则着重提升推理性能,预计2026年第一季度面世。高通此时入局,旨在抢占AI推理市场的关键窗口期。
AI推理与训练芯片的侧重点存在差异。训练场景强调芯片的并行计算能力,而推理场景更关注能效、时延与成本等综合表现。高通新品针对这些需求进行了优化设计:AI200机架解决方案支持单卡768GB低功耗内存,通过扩大容量降低成本;AI250则首次采用近内存计算架构,在提升带宽的同时降低功耗。两款方案均配备直接液冷散热系统,单机架功耗达160kW,并通过PCIe纵向扩展与以太网横向扩展实现高效连接。
市场研究机构巴克莱银行预测,到2026年,AI推理计算需求将占通用人工智能总需求的70%以上,甚至可能达到训练需求的4.5倍。然而,现有芯片资源难以满足这一增长,预计需新增近3000亿美元的资本支出。面对这一缺口,高通选择与竞争对手正面交锋。若以巴克莱的预测为基准,即便仅占据1%的市场份额,也将为高通带来可观的营收增长。
高通的数据中心布局并非一蹴而就。2018年,其服务器芯片部门曾因高层离职与大规模裁员被外界解读为退出该领域。直到2024年,公司CEO Cristiano Amon在Computex展会确认重返数据中心市场,并启动一系列动作:2025年5月宣布与英伟达合作定制CPU,用于加速GPU通信;6月以24亿美元收购半导体IP企业Alphawave,以增强高端接口技术;近日又通过与HUMAIN的合作,将业务延伸至中东市场。
尽管布局节奏紧凑,但数据中心板块的营收贡献仍需时间沉淀。Amon在财报电话会中透露,高通正与一家超大规模云端服务供应商深入洽谈,预计最快2028会计年度开始产生相关收入。与此同时,高通也在拓展智慧驾驶、物联网等多元化场景,以降低对单一业务的依赖。值得注意的是,其与苹果的基带芯片供应协议将于2026年末到期,而苹果目前占高通营收约20%,如何填补这一缺口将成为市场关注的焦点。











