国产GPU领域近日迎来重要突破,天数智芯公司正式对外公布其四代GPU架构技术路线图,计划在未来几年内实现多项关键技术超越国际领先水平。根据规划,该公司将于2025年推出天枢架构,性能指标将超越英伟达Hopper(H200系列);2026年发布的天璇架构将与Blackwell(B200)对标,同年推出的天玑架构则实现全面超越;2027年问世的天权架构将领先于Rubin架构,此后将转向突破性计算芯片研发。
针对行业普遍存在的能效比不足、应用适配困难等问题,天数智芯技术负责人单天逸表示,公司通过全栈优化设计显著降低客户总体拥有成本(TCO)。其技术方案支持从传统算法到未来未知算法的无缝演进,并借助精准仿真系统实现部署前的性能预判,确保复杂场景下的稳定运行。这种"所见即所得"的设计理念,有效解决了实际使用中的性能波动问题。
在具体技术实现上,天枢架构采用三项核心创新:计算组广播机制(TPC BroadCast)通过数据广播减少重复访存,等效提升带宽并降低功耗;多指令并行处理系统(Instruction Co-Exec)实现异构指令的同步执行,增强复杂任务处理能力;动态线程组调度系统(Dynamic Warp Scheduling)通过智能资源分配避免计算单元闲置。这些创新使天枢架构的能效比达到行业平均水平的1.6倍,在DeepSeek V3场景下较Hopper架构提升20%性能。
后续架构规划显示,天璇架构将新增ixFP4精度支持,天玑架构实现全场景计算覆盖,天权架构则融入更多创新设计元素。以天枢架构为例,其AI计算单元在执行注意力机制相关任务时,算力有效利用率突破90%,这在科学计算与AI融合场景中具有显著优势。公司董事长盖鲁江强调,自主通用GPU的发展需要构建开放生态,通过全栈自研技术筑牢产业根基。
中国工程院院士刘韵洁对天数智芯的技术路线给予高度评价。他指出,AI算力发展需要实现"量质齐升",既要突破单点性能瓶颈,更要构建软硬件协同的完整生态。天数智芯通过持续自主创新,在数据中心到边缘计算的全场景覆盖方面走出独特发展路径,其生态共建模式为国产算力产业提供了重要参考。
据技术团队披露,天枢架构已完成关键技术验证,相关芯片产品进入流片准备阶段。该公司表示,未来将与产业链伙伴深化合作,推动自主GPU技术在智能制造、智慧城市等领域的规模化应用,助力构建安全可控的国产算力生态体系。








