近日,智谱与华为携手宣布开源新一代图像生成模型GLM-Image,这一成果标志着国产AI技术取得重要突破。该模型基于昇腾Atlas 800T A2硬件平台与昇思MindSpore框架开发,实现了从数据预处理到模型训练的全流程国产化,成为首个在国产芯片上完成完整训练的多模态SOTA模型。
开源仅24小时内,GLM-Image便登顶全球知名AI开源社区Hugging Face的热门榜单首位。这一成绩不仅刷新了国产模型在国际开源社区的排名纪录,更验证了国产算力支撑大规模AI训练的可行性,为国内AI生态建设提供了重要参考。
技术架构方面,GLM-Image突破传统开源方案,采用"自回归编码+扩散解码"的混合架构设计。这种创新结构在保持与主流方案兼容性的同时,显著提升了知识密集型场景下的生成效果,尤其在复杂指令理解与长文本渲染方面表现突出。
在性能验证环节,该模型在CVTG-2K复杂视觉文本生成和LongText-Bench长文本渲染两项国际权威基准测试中均取得开源模型第一的成绩。测试数据显示,模型在汉字生成任务中展现出独特优势,能够准确理解多层次语义指令,生成符合视觉规范的专业级内容。
据开发团队介绍,GLM-Image项目聚焦全流程创新,是针对新一代"认知型生成"技术范式的探索实践。通过与昇腾生态的深度适配,模型在训练效率上达到硬件理论性能上限,为国产AI芯片在多模态领域的应用开辟了新路径。
目前,GLM-Image已面向全球开发者开放完整代码与模型权重,提供GitHub和Hugging Face双平台访问通道。其开源内容包含训练框架配置、数据预处理流程及推理部署方案,为行业提供了可复现的国产化技术方案。该模型在海报设计、PPT生成、科普可视化等知识密集型场景具有广泛应用前景,相关技术文档已同步发布至开源社区。











