在AI技术加速向应用端渗透的背景下,云天励飞董事长陈宁在战略前瞻会上明确指出,当前行业已进入大规模落地阶段,降低推理成本成为破局关键。公司宣布未来三年将集中资源突破大模型商业化瓶颈,通过底层架构创新实现百万Tokens推理成本下降超百倍,推动AI从实验室走向千行百业的生产场景。
全球算力产业正经历结构性变革,推理侧竞争成为新焦点。谷歌最新发布的第七代TPU"Ironwood"通过系统级优化提升推理能效,英伟达则通过技术授权与人才整合强化推理能力,两大国际巨头的布局印证了行业趋势。云天励飞高管分析称,单纯追求模型参数规模的时代已告终结,单位推理成本与交付效率成为决定规模化应用的核心指标。
针对推理场景的特殊需求,云天励飞提出GPNPU技术路线,创造性地将GPGPU通用性、NPU高效性与3D堆叠存储技术融合。该架构通过兼容CUDA生态降低开发门槛,利用专用计算单元提升能效比,并采用3D堆叠技术突破内存带宽限制。工程实现上,"算力积木"架构支持通过Chiplet技术灵活扩展算力,形成覆盖边缘计算到云端集群的完整产品线。
在产品规划层面,公司CTO李爱军透露DeepVerse芯片将围绕成本、时延、吞吐三大矛盾持续迭代。研发团队正重点优化长上下文预填充与低时延解码等关键环节,确保在真实业务负载下实现"更经济、更稳定、更易用"的交付目标。这种以场景驱动的技术演进路径,使产品能够快速适配不同行业的差异化需求。
组织架构调整为战略落地提供支撑。去年完成的"1+4"体系变革中,AI大算力芯片成为核心业务单元,四大事业部则构建起从研发到市场的完整价值链。其中政企事业部将依托行业经验,重点推进推理设备与智算中心建设,区域级"千卡集群"计划已在多个城市启动试点,旨在打造AI算力基础设施新标杆。
供应链安全保障成为竞争优势。公司高级副总裁邓浩然强调,通过提前布局国产制造产能,云天励飞已建立稳定的芯片交付体系。这种前瞻性的产能储备不仅规避了国际环境波动风险,更为即将到来的大规模商业化提供了产能保障,使公司在价格竞争与交付周期上占据主动地位。








