在人工智能技术快速发展的背景下,全球算力需求结构正经历深刻变革。以新一代智能代理应用为代表的推理场景爆发,推动行业重心从模型训练向实时推理转移。据德勤最新行业预测,到2026年,AI计算资源中用于模型推理的比例将攀升至三分之二,催生出价值数十亿美元的专用优化芯片市场,部分产品的功耗水平甚至超越传统通用芯片。
NVIDIA即将在加州圣何塞举办的GTC大会引发资本市场高度关注。公司创始人黄仁勋此前透露将推出"颠覆性"新品的消息,引发业界对技术路线的激烈讨论。综合多方分析,这款被推测为整合Groq语言处理单元(LPU)的推理芯片,可能采用三维堆叠架构实现性能突破。这种设计通过将SRAM存储单元直接集成在GPU核心上方,有望解决传统GPU架构中计算核心与高带宽内存(HBM)间的数据传输瓶颈。
当前AI推理面临的核心挑战在于解码阶段的时延问题。传统架构中,模型参数存储在HBM中,计算单元与存储器间的频繁数据交换导致效率损失。Groq LPU创新性地采用片上SRAM存储方案,其230MB容量即可提供80TB/s的内存带宽,数据处理速度较GPU架构提升显著。但行业专家指出,面对千亿参数级大模型,纯SRAM方案在存储容量上存在根本性局限,这促使厂商探索混合架构解决方案。
云岫资本AI领域专家庄昌磊分析认为,英伟达可能借鉴AMD的3D V-Cache技术,通过台积电系统集成芯片(SoIC)工艺,将包含大容量SRAM的LPU单元垂直堆叠在GPU晶圆上。这种设计既保留了GPU的软件生态优势,又吸收了LPU的架构特性。供应链消息显示,最终产品可能采用"LPU+GPU+HBM"的三明治结构,其中HBM仍负责大容量存储,而LPU单元专注提升解码效率。
三维堆叠技术正在重塑半导体产业格局。AMD早在2021年就推出垂直缓存技术,富士通也于近期展示了3D SRAM处理器计划。这种技术路线虽然解决了传统SRAM的密度限制,但对晶圆制造精度提出极高要求。东方证券研究指出,SRAM堆叠需要在晶圆阶段完成分子级键合,导致先进制程的价值进一步凸显,可能加剧行业对3纳米等尖端工艺的依赖。
产业变革带来新的竞争态势。技术门槛的提升可能使本土封测厂商在高端市场面临挑战,但同时也创造了差异化机遇。专家建议,国内企业可聚焦非尖端工艺的3D堆叠方案开发,或在测试、散热等后端环节构建技术壁垒。中信证券研究显示,未来GPU与神经网络处理器(NPU)都可能采用类似设计,通过垂直堆叠SRAM实现带宽飞跃,这预示着半导体价值链将持续向制造环节前移。











