谷歌TPU正以惊人的速度崛起,向英伟达在AI硬件领域的霸主地位发起强力挑战。随着谷歌Gemini 3的发布,TPU再次成为全球科技界关注的焦点,资本市场也随之震动,谷歌股价的攀升让一个话题再度被热议:谷歌TPU是否真能与英伟达GPU一较高下?
SemiAnalysis,这家在半导体和人工智能领域极具影响力的研究与咨询公司,近期发布了一篇由12位作者共同撰写的深度分析文章,明确指出TPUv7已向英伟达发起冲锋。文章深入剖析了谷歌TPUv7如何对英伟达的AI硬件霸权构成实质性威胁,其核心在于谷歌打破了长期以来的内部自用惯例,开始大规模向Anthropic等外部客户出售TPU硬件及算力。据悉,Anthropic已部署超过1GW的TPU集群,这一举动无疑为谷歌TPU的商业化进程注入了强大动力。
尽管在单芯片理论参数上,TPU未必能全面碾压英伟达GPU,但谷歌凭借卓越的系统级工程能力,如ICI互联和光路交换技术,实现了极高的实际模型算力利用率(MFU)。同时,谷歌TPU的总体拥有成本(TCO)比英伟达GB200系统低约30%-40%,这一优势使得谷歌在性价比方面更具竞争力。谷歌正积极修补软件短板,通过支持PyTorch原生环境和vLLM等开源生态,试图从根基上瓦解CUDA的护城河。
目前,世界上最顶尖的两个模型——Anthropic的Claude 4.5 Opus和谷歌的Gemini 3,其绝大部分训练和推理基础设施都运行在谷歌的TPU和亚马逊的Trainium上。尤其是Gemini 3及其所有早期版本,均完全在TPU上进行训练。这一事实不仅证明了TPU的强大性能,也彰显了谷歌在AI领域的深厚积累。不仅如此,谷歌还在向多家公司出售商用TPU硬件,进一步扩大了其市场份额。英伟达的王座因此迎来了新的挑战者,其霸主地位开始出现裂痕。
回顾谷歌TPU的发展历程,其起源可追溯至2006年谷歌建立AI专用基础设施的想法。然而,直到2013年,谷歌才开始为TPU芯片奠定基础,并于2016年将其投入生产。同年,亚马逊也启动了Nitro计划,专注于开发芯片以优化通用CPU计算和存储。如今,通过推进TPU商业化,谷歌已成为英伟达最新且最具威胁的挑战者。Gemini 3的发布引发了市场的强烈反响,英伟达甚至专门发布推文恭喜谷歌在AI领域的进展,同时不忘强调自己依然遥遥领先。
在推文中,英伟达强调自己仍在持续向谷歌供应硬件,并表示自己依然领先行业一代,是唯一能够运行所有AI模型、并能在各种计算场景中使用的平台。同时,英伟达还指出GPU比专用芯片(ASIC)在性能、通用性和可替代性上更强,这明显是对谷歌TPU、AWS Trainium等专用芯片的回应。然而,面对TPU的崛起,英伟达也不得不面对来自市场的质疑,尤其是关于其通过“循环经济”造成AI泡沫的指责。许多质疑者认为,英伟达通过资助烧钱的AI初创公司,本质上是将钱从一个口袋转移到另一个口袋。
SemiAnalysis认为,英伟达旨在通过股权投资而非降价来保护其在基础实验室的主导地位。降价将拉低毛利率并引发投资者普遍恐慌,因此英伟达选择通过其他方式来维持其市场地位。与此同时,前沿实验室如OpenAI和Anthropic正通过采购(或威胁采购)TPU来降低GPU的总体拥有成本(TCO)。尽管OpenAI目前尚未部署TPU,但仅凭“转向TPU”这一可能,就已在其英伟达集群成本上节省约30%。OpenAI将“我随时可能改用TPU”作为一个巨大的谈判筹码,迫使英伟达为了留住这个大客户而变相给予巨额优惠。
谷歌TPU的大规模外部化是其崛起的关键一步。长期以来,TPU堆栈一直与英伟达AI硬件相抗衡,但主要是为了支持谷歌的内部工作负载。即使在2018年向谷歌云平台客户提供TPU之后,谷歌仍未将其完全商业化。如今,这种情况正在改变。谷歌已经动员了整个堆栈的努力,通过谷歌云平台或作为商用供应商销售完整的TPU系统,开启了TPU大规模商用的步伐。这一举措也使谷歌成为一个真正差异化的云提供商,吸引了如Anthropic等顶级客户的青睐。
Anthropic和其他客户之所以选择谷歌的TPU,原因在于TPUv7 Ironwood是一个优秀系统内的强大芯片。即使芯片在参数上落后于英伟达,谷歌的系统级工程也使得TPU堆栈在性能和成本效率方面都能与英伟达相匹配。这种组合为Anthropic提供了引人注目的性能和TCO,因此赢得了其大规模的订单。与英伟达通过GB200扩展其GPU生态一样,谷歌自2017年TPUv2以来也一直在机架内和跨机架扩展TPU。谷歌的ICI扩展网络也成为与英伟达NVLink匹敌的竞争对手。
在大模型时代,预训练前沿模型仍然是AI硬件中最困难和资源最密集的挑战。自2024年5月GPT-4o以来,OpenAI的顶尖研究人员尚未完成广泛用于新前沿模型的成功全规模预训练运行,而TPU平台则通过了这一测试。对于谷歌来说,在最具挑战性的硬件问题之一中悄悄挤入并建立性能领先地位,确实是一个令人印象深刻的壮举。尽管谷歌在芯片设计理念上相对于英伟达更为保守,但进入大模型时代后,其设计理念发生了明显转变。从最近两代为大模型设计的TPU:TPUv6 Trillium(Ghostlite)和TPUv7 Ironwood(Ghostfish)就可以看出这种变化。




















