在AI技术加速渗透各行业的背景下,推理芯片的性价比已成为决定AI大规模落地的关键因素。云天励飞董事长兼CEO陈宁在近期举办的大算力芯片战略前瞻会上明确指出,公司未来三年将聚焦于突破大模型应用的成本瓶颈,通过底层架构创新推动AI从技术验证转向规模化生产力应用。其核心目标是将百万Tokens推理成本降低百倍以上,并计划在2030年实现百亿Tokens推理成本降至一分钱人民币。
全球算力产业正经历结构性转变,推理侧需求呈现爆发式增长。谷歌于2025年4月发布的第七代TPU“Ironwood”明确将推理性能作为核心优化方向,通过系统级设计提升大规模推理的能效比。英伟达则在同年12月通过非独占许可协议引入Groq的推理技术,并吸纳其核心团队,强化自身在实时推理领域的竞争力。这些动向表明,行业竞争焦点已从模型参数规模转向单位推理成本与交付效率。
云天励飞提出的GPNPU技术路线成为破解成本难题的关键。该架构通过整合GPGPU的通用性、NPU的高效性以及3D堆叠存储技术,构建起“通用计算+专用加速+内存优化”的三维协同体系。在生态兼容方面,其架构支持CUDA代码直接迁移,大幅降低开发者适配成本;在能效优化层面,NPU的专用化设计使大模型推理的能效比显著提升;针对内存带宽瓶颈,3D堆叠存储技术将推理时延压缩至行业领先水平。
公司CTO李爱军透露,大算力芯片DeepVerse的研发将遵循“算力积木”理念,通过Chiplet技术实现计算单元的模块化组合。这种设计使芯片能够灵活覆盖从边缘设备到千卡集群的多样化场景,形成完整的算力产品矩阵。在工程化路径上,云天励飞采用“需求驱动迭代”模式,针对长上下文预填充、低时延解码等关键环节持续优化,确保在真实业务负载下实现成本与时延的双重突破。
组织架构调整为战略落地提供支撑。去年完成的“1+4”体系变革中,公司成立四大事业部协同推进芯片全生命周期管理:政企事业部依托行业经验主导推理设备与智算中心建设;其他事业部则分别负责技术优化、市场拓展与生态构建。区域级“千卡集群”计划已进入实施阶段,该标杆项目将验证城市级AI算力中心的商业化可行性。
供应链安全成为差异化竞争优势。云天励飞高级副总裁邓浩然强调,公司已建立国内领先的国产芯片产能保障体系,从晶圆制造到封装测试的全链条自主可控能力,为未来三年大规模量产交付提供了确定性支撑。这种产能布局不仅规避了国际供应链风险,更使公司能够根据市场需求灵活调整生产节奏。
陈宁将公司竞争力归纳为技术、产能、生态、市场、资本的协同效应。技术层面,GPNPU架构与“算力积木”设计形成双重壁垒;产能层面,国产供应链保障了交付稳定性;生态层面,CUDA兼容与开发者工具链降低了迁移成本;市场层面,四大事业部的垂直整合加速了场景落地;资本层面,战略资源的持续投入为长期研发提供保障。这五大维度的有机联动,构成了云天励飞应对行业变革的核心资产。








