在德国汉堡举办的ISC高性能计算大会上,全球算力行业的目光曾一度聚焦于GPU核心数量与频率的竞赛。然而,中国展台传来的突破性消息重新定义了竞争维度:全国产自主研制的“灵晟”超级计算机以2.19EFlops持续双精度浮点性能登顶全球超算TOP500榜单,中科曙光研发的ParaStor F9000全闪存储系统更是在IO500生产型榜单中同时斩获10节点与全节点双料冠军。这场“计算+存储”的双重突破,标志着中国算力正从单点性能竞赛转向系统能力创新的新阶段。
行业专家指出,当前万卡级超大规模集群发展遭遇瓶颈,单纯追求算力规模已触及物理极限。中国农业大学计算中心主任劳凤丹教授强调:“算力的核心价值在于智能产出效率,而非电力消耗规模。”这一观点得到广泛认同——当GPU因数据供给不足而空转时,再高的峰值性能都将成为“纸面富贵”。中科曙光分布式存储总工程师袁清波透露,ParaStor F9000的成功关键在于突破传统存储定位,通过端到端数据路径优化技术,将跨节点访问抖动降低至行业领先水平,确保在万卡规模下实现数据稳定高速传输。
这场变革背后是算力体系底层逻辑的重构。传统架构中,超算与智算呈现二元割裂:前者基于CPU架构擅长高精度科学计算,后者依托GPU/NPU架构专注低精度矩阵运算。但随着AI for Science等新兴领域发展,高精度计算与智能化算力的深度融合成为刚需。上海交通大学信息办主任林新华认为,全球仅有中美具备将超算与智算能力融合的系统级实力,中国需要在此领域建立标杆性架构。
中科曙光展示的AI基础设施方案体现了这种系统思维。其“算-存-网”协同设计通过scaleFabric高速互联网络消除万卡并发时的网络拥塞,ParaStor F9000存储系统实现GPU直通技术使存储主动参与计算路径优化,scaleX40箱式超节点采用无线缆正交架构提升算力密度。这套全链路协同架构已在国家超算互联网核心节点稳定运行超一年,支撑完成414.7亿原子规模液态水分子动力学模拟等世界级科研任务。
高端存储市场的格局变化印证了这种转型趋势。中科曙光北京公司副总裁何振观察到,客户选型标准正从品牌生态惯性转向系统效率与总拥有成本(TCO)。这种转变在万卡集群场景尤为明显——数据搬运能耗与延迟可能超过计算本身成本,迫使架构设计发生根本性变革。广州国家实验室生物信息中心主任李义学指出,未来算力竞争不仅需要技术突破,更需要构建让算力高效发挥的环境,二者缺一不可。
当前,中国算力发展路径已显现差异化特征。通过软件定义与系统优化提升单比特数据访问效率,实质上降低了对高端芯片的绝对依赖。中科曙光在ISC现场展示的scaleX万卡超集群案例显示,其架构重构使存储从被动数据搬运站转变为计算路径优化参与者。这种转变在414.7亿原子模拟项目中得到验证:系统联合龙讯旷腾MatPL软件,依托自研技术将传统需要数月完成的计算任务压缩至可接受时间范围,刷新了该领域世界纪录。
随着国家超算互联网建设推进,这种系统级创新正在产生实质性影响。ParaStor F9000已部署于数个万卡集群,在大模型训练、科学计算等场景持续优化。其技术路径揭示:当算力发展遭遇物理极限时,通过存算网协同设计、数据流动路径重构、异构算力智能调度等系统创新,能够开辟出超越芯片制程竞赛的新赛道。这种转变不仅改变着技术竞争格局,更在重塑全球算力基础设施的标准体系。











