华为公司近期宣布了一项重大决定,正式将其盘古人工智能模型的部分组件向公众开源。此次开源的组件包括拥有70亿参数的盘古稠密模型、具备720亿参数的盘古Pro MoE混合专家模型,以及基于昇腾架构的模型推理技术。
据悉,盘古Pro MoE混合专家模型的权重和基础推理代码,以及基于昇腾的超大规模混合专家模型推理代码,已经率先在开源平台上架。而盘古70亿参数模型的权重与推理代码也即将上线,供开发者下载和使用。
盘古模型是华为自主研发的人工智能产品,自2020年11月立项以来,经历了快速的发展。2021年4月,华为首次对外发布了盘古模型,并在今年6月推出了盘古大模型5.5版本,实现了在自然语言理解、计算机视觉、预测、多模态和科学计算等基础模型上的全面升级。尤其在自然语言大模型领域,华为推出了由国产算力完全训练的7180亿参数深度思考模型,这一成就标志着中国在利用国产算力训练世界级大模型方面取得了重要突破。
华为相关负责人表示,此次开源盘古模型的部分组件,是华为实施昇腾生态战略的重要一步,旨在推动大模型技术的深入研究与创新发展,并加速人工智能技术在各行各业的应用与价值实现。华为诚挚邀请全球的开发者、企业合作伙伴及研究人员下载并使用这些开源组件,同时期待他们能够提供宝贵的反馈意见,共同推动盘古模型的完善与发展。