ITBear旗下自媒体矩阵:

算力格局生变:TPU崛起,GPU独霸难续,英伟达等巨头如何破局?

   时间:2026-03-06 20:25:30 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

全球AI芯片市场正经历一场深刻变革,以GPU为主导的算力格局面临前所未有的挑战。OpenAI、Anthropic等科技巨头纷纷调整技术路线,将目光投向更具能效优势的非GPU架构芯片,一场关于算力未来的争夺战已悄然打响。

英伟达虽在2026财年交出亮眼成绩单——年收入突破2159亿美元,数据中心业务三年增长13倍,但市场反应却出乎意料。财报发布后股价先涨后跌,最终收跌5.46%,市值蒸发数千亿美元。这一反常现象背后,折射出行业对算力发展路径的深刻分歧。华尔街分析师指出,单纯依靠算力规模扩张的时代已经结束,能效比与延迟指标正成为决定芯片商业价值的核心要素。

传统GPU架构的固有缺陷日益凸显。由于计算单元与外部显存间的数据搬运路径长、次数多,导致能耗居高不下、延迟难以降低。路透社披露,OpenAI多次对英伟达芯片的响应速度表达不满,尤其在代码生成产品Codex上体验尤为明显。图灵奖得主David Patterson的研究证实,大模型每次token生成过程中,数据搬运消耗的能量远超实际计算所需。

在这场变革中,谷歌TPU成为最引人注目的挑战者。这款原本专供内部使用的芯片,自2025年推出第七代产品后开始走向商用市场。TPU v7单芯片峰值算力达4614 TFLOPS(FP8精度),在同等算力输出下功耗仅为英伟达B200的40%-50%。更关键的是,谷歌自研的光电路交换机技术使万卡级集群实现近乎线性的加速比,彻底解决了传统GPU集群规模扩大导致的通信损耗问题。

市场数据印证着TPU的崛起势头。摩根大通报告显示,谷歌计划在2027年部署600至700万颗TPU,其中大部分将供给Anthropic、OpenAI、meta等外部客户。高盛预测,全球AI服务器中非GPU芯片出货占比将从2024年的36%升至2027年的45%;IDC则指出,到2028年中国非GPU服务器市场规模占比将接近50%。

实际部署效果为TPU赢得更多订单。在TPU上训练的Gemini 3模型在多个权威基准测试中位居榜首,证明其性能已可与顶级GPU媲美。成本优势更是显著——TPU的能效比带来2-4倍优势,使大模型推理综合成本较GPU降低50%以上。这种优势直接反映在采购决策中:Anthropic向谷歌下达210亿美元订单,meta签下数十亿美元TPU租赁协议,苹果和xAI也成为潜在客户。

面对挑战,英伟达展开激烈反击。2025年底,公司以200亿美元溢价三倍收购AI芯片创企Groq,获取其核心技术和团队。Groq创始人Jonathan Ross作为谷歌TPU核心设计者之一,开创了"软件定义硬件"的数据流处理新范式。其TSP架构通过功能切片化微架构设计和静态调度机制,在保持可编程性的同时实现接近ASIC的极致性能,在相同推理任务中首token延迟比TPU v7降低20%-50%,每token成本降低10%-30%。

技术创新的浪潮正在重塑整个行业生态。清微智能、Cerebras等企业从不同维度突破传统架构限制:3D Chiplet技术构建三维立体数据流架构,算力网格技术实现灵活数据流计算范式,晶圆级芯片技术将数据流架构优势发挥到极致。以Cerebras为例,其CS-3系统推理性能比英伟达旗舰DGX B200快21倍,成本与功耗均降低三分之一。OpenAI实测显示,基于该系统的Codex-Spark代码生成速度突破每秒1000 token,首次实现实时交互体验。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version