在人工智能从“基础模型构建”向“规模化应用落地”转型的关键节点,云天励飞近日举办“大算力芯片战略前瞻会”,正式公布未来三年大算力AI推理芯片的战略布局。公司宣布将集中核心研发资源突破大模型落地的“成本壁垒”,通过底层架构创新实现百万Tokens推理成本降低超100倍的目标,推动AI技术从实验室走向普惠化生产场景。
全球算力产业重心正加速向推理侧倾斜。谷歌2025年4月发布的第七代TPU“Ironwood”明确定位为“推理时代基石”,重点优化大规模推理能效;英伟达同年12月斥资200亿美元与推理芯片厂商Groq达成非独占许可协议,吸纳其核心团队强化实时工作负载能力。行业信号显示,推理竞争已从“参数规模”转向“单位成本与交付效率”,能效比成为规模化落地的核心门槛。
云天励飞提出GPNPU技术路线,以“GPNPU = GPGPU + NPU + 3D堆叠存储”公式重构芯片架构。该路线通过兼容CUDA生态实现一行代码迁移,降低企业应用门槛;采用NPU专用化设计提升能效比,针对大模型推理的结构化负载优化成本;研发3D堆叠存储技术突破“内存墙”瓶颈,降低推理时延。公司CTO李爱军强调,架构创新需兼顾通用性与专用性,在工程层面解决可迁移、可部署、可持续降本三大难题。
在产品化路径上,云天励飞推出“算力积木”架构,通过Chiplet技术实现算力模块化扩展,支持从边缘设备到千卡集群的弹性部署。公司拒绝单纯堆砌芯片参数,转而围绕真实业务负载进行系统级优化,逐项击穿推理链路中的成本与时延瓶颈。目前,其政企事业部已启动区域级“千卡集群”建设,旨在树立城市AI算力赋能标杆。
支撑战略落地的核心在于五大要素协同:技术层面,公司聚焦AI大算力推理芯片研发;产能层面,其国产供应链储备为大规模量产提供确定性;生态层面,四大事业部覆盖研发、优化到推广的全链条;市场层面,政企事业部主导推理设备与智算中心建设;资本层面,市值突破万亿元的愿景彰显长期信心。董事长陈宁特别指出,供应链安全是当前行业竞争的关键变量,云天励飞已构建起抵御外部风险的护城河。
根据规划,云天励飞未来三年将梯度推进DeepVerse芯片研发,对标国际主流平台优化长上下文预填充、低时延解码等关键环节。2028年产品将采用PD分离、AFN分离及超节点架构设计,性能指标有望比肩英伟达Rubin架构。公司强调,推理时代的竞争本质是“单位推理成本”之争,唯有将技术做得足够便宜、稳定、易用,才能推动AI从“能力展示”转向“生产力工具”。











