ITBear旗下自媒体矩阵:

中科曙光李斌谈AI:打破封闭壁垒,以开放生态驱动国产算力集群创新

   时间:2025-12-27 01:40:58 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在光合组织举办的人工智能创新大会上,中科曙光正式推出国内首款万卡级AI集群系统——Scale X万卡超集群,并以真机形式完成首次公开亮相。这款系统标志着国产算力基础设施在规模化、开放化方向取得关键突破,其技术指标与实测性能已达到国际主流产品水平。

该集群由多个Scale X640超节点通过ScaleFabirc高速网络构建,总计集成10240块加速卡,总算力突破5EFlops(每秒500亿亿次计算),内存总容量达650TB,片间互连带宽超过4.5PB/s。系统采用开放架构设计,硬件层面支持多品牌加速卡接入,软件层面完成400余款主流大模型的适配优化,形成覆盖通用计算与行业应用的完整生态。

中科曙光高级副总裁李斌在接受采访时指出,超大规模算力集群的研发面临三大技术挑战:首先是互联网络需实现高带宽、低延迟的无损传输,其研发难度远超传统以太网;其次是能耗控制,随着算力中心向吉瓦级规模演进,用电与冷却技术成为制约系统稳定性的关键因素;第三是协同优化难题,AI算力需求指数级增长与数据传输、存储性能提升不同步形成的"性能鸿沟",导致计算资源无法充分释放。

针对这些挑战,研发团队通过单点技术突破与系统级优化相结合的方式实现技术攻坚。例如在互联网络方面,采用原生支持的无损网络架构,确保大规模组网后的可管理性;在能耗控制领域,开发新型冷却技术以应对百兆瓦级算力中心的散热需求;通过动态调整计算、存储、网络资源的分配比例,最大限度缩小性能鸿沟。

"我们拒绝做封闭的'算力孤岛'。"李斌强调,开放生态是破解行业困局的关键。当前AI产业链存在"全链条覆盖"的误区,导致各环节技术深度不足,形成多个互不兼容的小生态。这种封闭模式既增加用户选择成本,也阻碍技术迭代速度。中科曙光通过开放架构联合实验室,将自身在芯片互联、软件栈、硬件架构等领域的技术积累向产业链共享,帮助中小企业降低基础平台搭建成本。

据介绍,该联合实验室已吸引20余家智算上下游企业参与,初期设立芯片互联、底层软件栈、冷却技术等专项工作组。通过提供标准化技术平台与共享资源,中小企业可专注于算法优化、数据治理等核心能力建设,避免重复投入硬件适配研发。目前已有多个细分领域的创新项目借助该平台完成原型验证。

尽管Scale X万卡超集群在集群规模、开放生态等方面实现突破,但李斌坦言,国产算力在芯片制程等基础领域仍与国际领先水平存在差距。这种差距需要通过持续技术迭代与产业链协同逐步缩小,而开放生态的构建将为更多企业提供技术追赶的支撑平台。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version