中国电信研究院携手中国科学院计算技术研究所、华为昇腾及沐曦等合作伙伴,依托中国电信云网融合技术中试验证平台,成功完成了一项具有里程碑意义的技术突破——业界首个面向国产算力的跨架构大模型推理技术验证。这一成果标志着我国在人工智能算力适配领域迈出了重要一步。
此次技术攻关的核心项目为“Triton统一跨架构推理框架”,由中国电信研究院主导研发。该框架通过自主研发的Triton跨架构编译器与统一大模型算子库,实现了同一套算子源码在英伟达、昇腾、沐曦三类主流芯片上的无缝兼容运行。这一创新解决了不同芯片架构间算子适配的难题,为国产算力生态的统一化发展提供了关键技术支撑。
在验证过程中,团队完成了10余款主流开源模型在三类芯片上的端到端推理测试。测试数据显示,该框架在多项核心指标上表现突出:平均迁移时间缩短至3天以内,较传统适配模式效率提升超过80%;模型推理精度误差控制在0.5%以下,确保了输出结果的可靠性;在同等延迟约束条件下,系统吞吐量达到各芯片原生算子库的90%以上,实现了性能与适配效率的双重优化。
为进一步提升技术实用性,框架还内置了benchmark与Profiling工具,可一键生成跨芯片性能对比报告。这一功能为业务方在芯片选型时提供了直观的数据参考,有助于根据实际需求选择最优算力方案,降低技术迁移成本。
作为中国电信集团的核心研发机构,中国电信研究院长期聚焦6G、光网络、卫星通信等前沿领域的技术攻关。此次跨架构推理框架的成功验证,不仅展现了其在人工智能算力领域的创新能力,也为国产芯片生态的协同发展提供了可复制的技术路径。











