ITBear旗下自媒体矩阵:

智谱GLM-5.1“Day0”上线华为云 昇腾算力优化推理加速吞吐提升30%

   时间:2026-04-09 02:06:44 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

华为云与智谱联合宣布,新一代开源大模型GLM-5.1正式上线华为云平台,成为全球首个具备8小时级持续工作能力的开源模型。该模型在SWE-bench Pro基准测试中表现突出,首次超越国际主流模型Opus 4.6,标志着国产大模型在复杂软件开发场景中取得关键突破。

技术层面,GLM-5.1通过深度优化昇腾算力架构实现重大创新。研发团队在模型层采用Layer级MOE均衡设计,结合华为昇腾Attention算子特性,构建起推理框架与硬件的协同优化机制。这种创新架构使算力分配效率提升40%,HBM访存均衡度提高35%,配合华为云系统级优化方案,整体推理吞吐量较前代提升30%。

华为云为开发者提供双重服务模式:通过MaaS平台可即开即用GLM-5.1的API服务,支持实时在线体验;企业用户则可借助ModelArts平台快速完成模型部署,提供公共算力池与专属算力池两种资源方案,灵活满足不同场景的算力需求。这种分层服务策略有效降低了企业应用大模型的技术门槛。

作为开源生态的重要里程碑,GLM-5.1的代码与训练框架已完全开放。其持续工作能力突破传统模型2-3小时的续航限制,在连续8小时高强度任务中保持性能稳定。在真实软件开发场景测试中,该模型展现出更强的代码生成准确性和复杂逻辑处理能力,特别是在多文件协同修改、第三方库调用等场景表现优异。

华为云与智谱的此次合作,构建起从底层算力到上层应用的完整技术栈。通过硬件架构与模型算法的深度适配,双方验证了国产AI基础设施在处理超大规模参数模型时的技术可行性,为金融、制造、科研等领域的大模型应用提供了新的技术范式。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version