近期,网络上流传着一则消息,引起了人工智能领域的广泛关注。传闻指出,华为推出的盘古大模型(Pangu Pro MoE)与阿里巴巴达摩院公布的通义千问 Qwen-2.5 14B 模型在参数结构上存在高度相似性。这一说法伴随着一些疑似证据一同出现,迅速在业界引发了热议。
据称,一个名为HonestAGI/LLM-Fingerprint的研究团队在GitHub上进行了多个主流模型的对比研究,结果惊人地发现:盘古 Pangu Pro MoE 与 Qwen-2.5 14B 模型在注意力模块的设计上表现出极高的相似性,这在其他模型的对比中未曾出现过。这一发现让不少人猜测,盘古大模型可能是在Qwen模型的基础上进行训练或修改的,而非完全自主研发。
面对这一传闻,华为盘古Pro MoE技术开发团队迅速做出了回应,发布了官方声明。声明中表示,盘古Pro MoE开源模型的部分基础组件代码实现确实参考了业界的开源实践,并涉及到了其他开源大模型的部分代码。华为强调,他们严格遵循了开源许可证的要求,在开源代码文件中清晰地标注了开源代码的版权声明。这一做法不仅符合开源社区的通行规则,也体现了业界所倡导的开源协作精神。
华为团队在声明中还提到,他们始终坚持开放创新的原则,尊重第三方的知识产权,并积极倡导包容、公平、开放、团结和可持续的开源理念。团队对于全球开发者与合作伙伴对盘古大模型的关注和支持表示感谢,并高度重视开源社区的建设性意见。华为希望通过盘古大模型的开源,与志同道合的伙伴们一起,不断探索并优化模型能力,加速技术的突破与产业的落地。