近日,智谱与华为携手推出新一代开源图像生成模型GLM-Image,并宣布该模型已基于昇腾Atlas 800T A2服务器与昇思MindSpore AI框架完成全流程训练与推理适配。这一成果标志着国产全栈算力体系首次成功支撑起前沿生成式模型的完整开发链路,为AI技术国产化落地提供了重要实践样本。
在技术架构层面,GLM-Image突破传统LDM方案的局限,创新采用"自回归编码器+扩散解码器"的混合架构设计。该模型通过自回归机制实现全局语义理解,同时利用扩散模型强化局部细节生成能力,有效解决了知识密集型场景下的内容生成难题。尤其在中文文本渲染方面,模型展现出显著优势,能够精准处理汉字结构、笔画顺序等复杂特征,在海报设计、PPT制作、科普插图等应用场景中表现突出。
开源社区反响热烈,模型上线不足24小时即登顶Hugging Face平台全球热度榜首位。性能测试数据显示,在昇腾Atlas 800T A2集群上,GLM-Image的训练效率达到硬件理论性能上限的92%,推理延迟控制在150ms以内。这一成果验证了国产AI芯片与框架的协同优化能力,为构建自主可控的AI基础设施提供了关键技术支撑。
据研发团队介绍,GLM-Image的训练过程实现了从数据预处理到模型部署的全链条国产化。通过动态图模式与静态图模式的混合编程,团队在昇思MindSpore框架上开发出自适应算子融合算法,使计算资源利用率提升40%。该模型目前已开放商业授权申请,支持教育、科研、文创等领域的应用开发,有望推动认知型生成模型在专业场景的深度应用。











