在近日举办的世界互联网大会·乌镇峰会前沿人工智能模型论坛上,蚂蚁集团平台技术事业群负责人骆骥透露,该集团已建成具备万卡规模的国产化算力基础设施。这一由国产芯片构建的集群不仅支持蚂蚁自研模型及主流开源框架,更在系统稳定性方面取得突破性进展,连续训练任务成功率保持在98%以上。
据技术团队介绍,该算力集群通过架构优化与算法调优,在模型训练效率与推理响应速度等核心指标上,已达到国际同类产品的同等水平。特别在安全风控场景中,依托该集群构建的大模型系统,能够实时处理海量数据并完成风险识别,为金融业务提供智能化支撑。
值得关注的是,这套国产化解决方案实现了从硬件到软件的全链路自主可控。工程团队通过分布式训练框架创新,解决了大规模集群下的通信瓶颈问题,同时开发了动态资源调度系统,使算力利用率较传统方案提升40%以上。目前该集群已承载蚂蚁集团多个核心业务的模型训练任务,日均处理数据量超过PB级。
业内专家指出,万卡级国产算力集群的落地,标志着我国在人工智能基础设施领域取得重要进展。这种自主可控的技术栈不仅降低了对进口芯片的依赖,更通过定制化优化释放了国产硬件的潜在性能,为金融科技等关键领域提供了安全可靠的算力保障。











