一场围绕AI芯片的技术博弈正悄然改写行业格局。英伟达以200亿美元收购Groq团队及非独家技术授权的交易,不仅刷新了其并购金额纪录,更将“非GPU”技术路线推向聚光灯下。这场收购的核心目标直指AI推理市场——随着大模型从训练转向规模化部署,低延迟、高能效的推理需求正成为算力竞争的新战场。
Groq的LPU芯片技术以“软件定义硬件”的可重构数据流架构为基石,被业内视为谷歌TPU的“进阶版”。其独特之处在于取消了传统GPU中的指令分发、缓存控制等硬件模块,通过编译器将计算步骤精确到时钟周期,配合高速SRAM内存,实现了推理延迟比GPU低5-18倍、能效高10倍的突破。这种架构在运行万亿参数大模型时,可实时生成token,直接挑战GPU在推理场景的统治地位。
英伟达的算盘不仅限于技术整合。Groq在沙特市场的布局成为关键筹码——2025年初,该公司获得沙特15亿美元投资承诺,并建成该国最大推理集群。对于觊觎主权AI市场的英伟达而言,这笔交易相当于以近三分之一的现金储备(预计2025年底达700亿美元)换取了进入中东市场的“入场券”。更值得关注的是,Groq在2025年9月完成7.5亿美元融资后估值已达69亿美元,其营收目标中超80%来自推理服务及基础设施订单,印证了市场对非GPU路线的认可。
技术流派的分化愈发清晰。GPU阵营以英伟达、摩尔线程为代表,凭借生态优势主导训练市场,但推理场景的高能耗短板日益凸显;ASIC/DSA路线(如谷歌TPU、寒武纪)通过硬件固化矩阵运算优化性能,却面临算法迭代时的适配困境;而可重构架构(Groq、SambaNova、清微智能)则试图在灵活性与效率间寻找平衡点——其动态重构计算路径的能力,既能降低能耗,又可适应模型演进需求。
Groq的“确定性”优势成为杀手锏。通过预编译推理任务流程,其硬件可精准执行数据传输路径与时间分配,实现多芯片协同的毫秒级响应。这种“软件定义硬件”的模式,本质上是通过优化硬件利用率提升性能,而非单纯依赖制程工艺进步。在先进制程受限的背景下,这一思路为中国芯片产业提供了破局方向。
资本市场的风向随之转变。2025年12月,可重构架构代表企业清微智能完成超20亿元C轮融资并启动IPO,成为国内“非GPU”赛道首个冲刺上市的标杆。该公司芯片已累计出货超3000万颗,在全国十多座千卡规模智算中心落地,算力卡订单突破3万张。其自主研发的TSM-LINK互连技术支持多芯片直连,规避了传统交换机架构的带宽瓶颈,为大规模扩展铺平道路。
生态建设成为下一阶段竞争焦点。清微智能正加速推进软件栈适配与工具链开发,以降低开发者迁移成本。中国丰富的端侧AI场景(如智能制造、智慧城市)对低延迟的严苛要求,为可重构芯片提供了天然试验场。据IDC数据,清微智能已跻身国内AI芯片出货第一梯队,其3D扩展架构更可与晶圆级集成技术结合,形成可持续的迭代路径。
英伟达的豪赌为行业划下新坐标。200亿美元的估值锚定了可重构架构的技术价值,也让资本市场重新审视“软件定义硬件”的潜力。当AI商业化进入“快与便宜”的阶段,这场由非GPU路线引发的变革,或将重塑全球算力版图。










