在人工智能(AI)领域,训练与推理两大核心环节相辅相成,如同教育的“学习”与“考试”。训练阶段,如同学生汲取知识,需要庞大的数据集与强大的计算能力作为支撑;而推理阶段,则类似于学生应用所学解答问题,强调快速、准确地应对实际应用场景的需求。随着AI技术应用的日益广泛,推理算力的需求显著增长。据国际数据公司(IDC)数据显示,2022年,云端推理算力占比已达到58.5%,并预计将在2026年进一步上升至62.2%。
近期,一家在AI芯片领域深耕11年的上市公司,宣布将重心转向大模型推理算力的发展。7月25日,在2025年世界人工智能大会(WAIC)前夕,云天励飞(股票代码:688343.SH)正式发布了深穹Edge200芯片以及深穹X6000 Mesh推理计算卡等一系列新品。
深穹X6000 Mesh推理加速卡,以其高达256Tops的算力,专为AI推理计算设计,能够支持30fps的1080p视频解码,满足千亿参数大模型的推理应用需求。基于这款加速卡,云天励飞还推出了深目6203视频高密2U推理一体机、天舟6408大模型4U推理一体机以及天舟680G大模型满血版8U推理一体机,提供最高可达4PFlops的推理算力,助力AI模型的商业化落地。
云天励飞董事长兼CEO陈宁表示,公司正全面聚焦于AI推理芯片领域。2025年是AI发展的关键转折点,大模型技术不断成熟,调用成本大幅降低。尽管当前AI推理芯片市场相较于训练芯片市场仍显小众,但预计未来三至五年内,其增长速度将远超训练芯片。这标志着AI正从训练时代迈入推理时代,推理算力的需求将迎来爆发式增长。
陈宁进一步指出,未来五年,AI将重塑机器人、AI眼镜等终端硬件产品,推理算力网络将无处不在。作为底层算力设施,AI推理芯片将贯穿端、边、云,构建无处不在的算力网络,使各类智能体能够更好地服务于人类的工作与生活。
成立于2014年的云天励飞,拥有大模型和AI芯片两大技术平台,业务覆盖消费级、企业级和行业级三大场景。经过11年的发展,云天励飞已推出五代神经网络处理器(NPU),并形成了一系列产品矩阵。早在2020年,云天励飞就全面转向国产工艺,成为首家采用国产Chiplet工艺的AI芯片公司。
2023年,云天励飞正式发布基于“算力积木”架构的DeepEdge10芯片平台,包括DeepEdge10C、DeepEdge10标准版、DeepEdge10Max和DeepEdge200四款芯片,算力范围覆盖8T至256T,满足从小型边缘设备到智算中心高性能计算的需求。云天励飞还推出了面向云、边、端的AI推理产品系列,包括模组、边缘智能盒子、AI推理加速卡、大模型推理一体机以及智算服务器等。
随着AI热潮的兴起,云天励飞的业绩持续增长。财报显示,2024年,公司营业收入超过9亿元,同比增长81.3%。截至2025年第一季度,公司营收达到2.64亿元,同比大幅增长168.23%,创历史同期新高。在消费级业务方面,云天励飞通过智能穿戴设备和AI硬件产品线,预计2025年上半年将保持50%以上的增速。
对于为何从边缘AI计算战略转向AI模型推理算力,陈宁表示,对于中国而言,AI推理芯片是推动AI产业大规模落地的关键领域和关键技术。未来五年,大模型、算法和推理芯片为核心的AI技术将重新定义人类的电子产品;未来五到十年,以推理芯片为核心的AI算力网络将无处不在。
云天励飞深穹X6000 Mesh加速卡具有多项核心技术特点,包括采用自研第四代NPU,高效支持Transformer架构;Edge芯片采用国产工艺制造,并通过自主可控国产化C级认证;作为国内首颗量产的基于国产先进工艺的“算力积木”架构的AI芯片,它实现了片间算力扩展,满足千亿级大模型部署需求。
陈宁透露,目前基于深穹X6000 Mesh推理加速卡的推理一体机正在逐步量产落地。同时,云天励飞在智算中心领域也有所布局,服务于城市级智算中心建设、科研院所、运营商以及互联网大厂等客户。
云天励飞CTO李爱军透露,下一代“算力积木”架构和AI推理芯片将有五个方面的重要升级,包括采用新型计算、近存计算、NB-Mesh新型互联、新型封装以及NB-Link通用扩展性等,以满足嵌入式物联网、边缘端、云推理对边缘大模型、MoE大模型的极致推理效率、能效比和性价比需求。基于第二代“算力积木”架构的云天励飞下一代AI推理芯片预计将于2026年底陆续推出。
面对国产芯片发展的挑战与机遇,陈宁表示,云天励飞作为国产AI芯片公司,面临着起步晚、生态不完善等挑战,但团队拥有基于矩阵类并行计算芯片的基因、决心和信念,可以克服各种挑战。同时,云天励飞持续拥抱国产工艺,拥有市场差异化竞争优势。