英伟达近日宣布,将把Groq的AI推理技术整合至其未来产品体系,同时吸纳Groq创始人Jonathan Ross、总裁Sunny Madra及部分核心工程团队加入。尽管Groq公司仍保持独立运营,其云业务Groq Cloud也将持续对外服务,但这一动作远非简单的技术合作——芯片行业观察者指出,将竞争对手的核心架构团队整体引入,在行业内极为罕见。
这场合作背后,隐藏着AI算力竞争格局的深刻转变。随着行业焦点从模型训练转向推理应用,GPU长期主导的算力市场正面临结构性挑战。谷歌TPU凭借为神经网络推理定制的ASIC架构,在单位能耗、延迟控制及规模化成本上展现出显著优势,尤其在商业化阶段“算得起”的需求压倒“算得快”的优先级时,TPU的威胁愈发凸显。英伟达此次动作,被视为对谷歌TPU崛起的关键防御。
Groq的独特价值在于其技术路线与TPU的高度同源性。创始人Jonathan Ross作为谷歌TPU早期核心成员,带领团队坚持低延迟、确定性执行的推理架构理念,这与英伟达GPU的通用并行计算路径形成鲜明对比。行业分析认为,英伟达选择“引入”而非“自研”,正是看中Groq团队已验证的TPU式思维——相比从零开发,直接吸收成熟架构理念能更快缩小与谷歌的技术差距。
市场此前曾流传英伟达拟以200亿美元收购Groq的传闻,尽管被双方否认,但这一数字折射出英伟达的紧迫感。Groq今年目标收入约5亿美元,财务价值远不足以支撑如此估值,英伟达真正看重的实为“时间”——在推理时代加速来临之际,通过吸纳关键人才和架构思想,快速补齐自身短板。最终落地的技术许可加人才转移模式,既规避了监管风险,又避免了“被TPU逼入绝境”的舆论压力。
谷歌TPU的威胁已不止于技术层面。随着Ironwood TPU与Gemini模型体系的推进,谷歌与英伟达的竞争从“算力采购量”升级为“计算路线之争”。GPU仍统治训练市场,但在推理环节,TPU正快速逼近甚至反超。这种转变源于架构差异:GPU的通用性在训练阶段优势明显,而TPU的定制化设计在推理阶段更贴合商业化需求——当客户开始计算长期推理成本时,GPU的高溢价模式首次遭遇结构性挑战。
对谷歌而言,TPU不仅是芯片,更是成本结构的战略武器。通过TPU,谷歌云在推理环节逐步减少对英伟达的依赖,为未来十年竞争构建底层优势。若TPU与Gemini深度绑定,成为谷歌云的核心差异化能力,这场对抗将远未结束。英伟达“收编”Groq的举动,或许正是推理时代来临的信号——连行业霸主也不得不调整战略,以应对算力市场的新规则。









