在河南郑州国家超算互联网核心节点,中科曙光宣布国内规模最大的AI4S(AI for Science)计算集群正式投入使用。该集群采用6万卡并行架构,在算力、精度、网络、存储、调度及能效六大维度实现突破,为科研创新提供全新基础设施支撑。
集群算力性能达到国际顶尖水平,其超算算力与AI算力可同时满足从软件模型优化到科学智能体开发的全链条需求。在精度支持方面,系统实现8至64位全精度计算覆盖,为不同学科研究提供灵活适配能力。网络架构采用自主研发的scaleFabric系列高速互连技术,通过类InfiniBand无损网络设计,将带宽利用率提升至新高度,同时将通信延迟压缩至微秒级。
存储系统创新采用三层协同架构,通过芯片、系统、应用层面的传输优化,构建起五档加速体系。该方案有效破解存储IO瓶颈问题,确保海量科研数据的高效读写。在资源调度领域,系统实现每秒万次级并发作业处理能力,通过智能算法实现超算与智算资源的动态分配,使CPU与GPU的协同效率提升40%以上。
能效管理方面,集群采用浸没相变液冷技术与湖水冷却系统相结合的方案。通过多点取水设计,将退水温度波动控制在1℃以内,实现余热的全量回收利用。该系统等效水利用率接近零值,每年可减少二氧化碳排放达4万吨,为超算中心绿色转型树立新标杆。
为推动技术落地,中科曙光同步推出OneScience科学大模型开发平台。该平台集成地球科学、生物信息、材料化学等领域的数十个前沿模型与数据集,支持自然语言交互的科研任务拆解功能。研究人员通过语音指令即可完成算力调度,使复杂模拟实验的完成周期从数天缩短至数小时。
在具体应用场景中,集群已展现强大实力:在生命科学领域,3万卡规模蛋白质折叠模拟实现千倍级加速;材料科学方面,4.5万卡参与的万亿原子液态水分子动力学模拟突破世界纪录;流体力学研究实现百万亿网格规模的智能湍流直接模拟。这些突破标志着我国在AI4S核心应用领域进入全球领先行列。
随着该集群的启用,国家超算互联网平台形成覆盖全国的算力网络,现已整合超300万CPU核心与20万张GPU卡资源。通过接入一体化算网调度体系,平台可为全国科研机构提供弹性可扩展的计算服务,构建起支撑国家科技创新的战略性基础设施。











