ITBear旗下自媒体矩阵:

华为全面开源AI技术:CANN与三款盘古大模型亮相

   时间:2025-08-06 09:41:44 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

华为在AI领域迈出了重要一步,近日宣布将CANN(神经网络计算架构)全面开源开放。这一举动紧随其昨日开源三款盘古大模型的步伐,这些模型的参数规模分别为1B、7B和惊人的718B。

CANN,全称为Compute Architecture for Neural Networks,是华为专为AI场景设计的异构计算架构。其旨在提升华为昇腾AI芯片在处理复杂AI任务时的效率。此次全面开源,意味着开发者将能够更深入地利用这一架构,进行自定义开发,进一步丰富华为AI生态。

值得注意的是,华为早在2024年就已宣布对昇腾CANN进行深度开放,而此次的全面开源开放可以看作是这一策略的深化和补充。华为轮值董事长徐直军表示,Mind系列应用使能套件和工具链也将全面开源,为用户提供更为灵活的开发支持。

此次开源的三款盘古模型分别为openPangu-Embedded-1B-model、openPangu-Ultra-MoE-718B-model和openPangu-Embedded-7B-model。这些模型均基于昇腾NPU进行训练,并在Gitcode平台上提供了下载链接。

其中,openPangu-Embedded-1B是一个专为端侧设备运行设计的高效语言模型,它采用了26层Dense架构,并训练了约10T tokens。据称,该模型在保持端侧运行要求的同时,能够达到较高的精度。而openPangu-Ultra-MoE-718B则是一个混合专家语言模型,其总参数量高达718B,激活参数量为39B,训练了约19T tokens,并具备快慢思考融合能力。

openPangu-Ultra-MoE-718B在架构上采用了多种创新设计,如Multi-head Latent Attention(MLA)、Multi-Token Prediction(MTP)以及大稀疏比等,以提升模型的性能和训练效率。该模型还通过Depth-Scaled Sandwich-Norm和TinyInit等技术手段,提升了训练的稳定性。

华为在AI领域的这一系列举措,无疑将进一步推动其AI软硬件生态的发展。昇腾CANN作为连接华为AI硬件和上层应用的关键技术,其开源程度的提高将有助于吸引更多开发者加入,共同推动华为AI生态的成长。同时,盘古大模型的进一步开源也将与CANN形成协同效应,共同提升华为在AI领域的竞争力。

在当前国内AI赛道火热的背景下,华为昇腾AI芯片+盘古大模型的技术路径备受瞩目。随着自主可控成为行业关注的焦点之一,华为的这一组合有望成为推动国内AI产业发展的重要力量。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version