在华为开发者大会HDC2025的盛会上,华为云计算迎来了一个重要的里程碑时刻。华为常务董事兼云计算业务CEO张平安,向全球开发者隆重推出了盘古大模型的最新版本——5.5版。此次升级涵盖了自然语言理解NLP、计算机视觉CV、预测、多模态以及科学计算五大核心领域,为行业应用注入了全新的活力与价值。
张平安强调,盘古大模型5.5是在昇腾云的全栈软硬件环境下精心训练而成,这一成就标志着昇腾架构在全球大模型竞争中迈出了坚实的一步,具备了打造世界级大模型的能力。
在自然语言理解领域,盘古大模型5.5引入了全新的718B深度思考模型,该模型由256个专家系统组成的MoE架构支撑,尤其在知识推理、工具调用及数学处理方面展现出了卓越的能力。通过一系列创新算法,如通算掩盖、全局动态均衡以及分组混合专家MoGE等,盘古大模型实现了与昇腾平台的深度整合,训练效率与单卡推理性能均达到了业界领先水平。模型亲和的词表设计、三明治架构以及EP-Group负载均衡loss等技术,进一步增强了模型的竞争力,使之与业界顶尖模型比肩。
在用户体验方面,盘古大模型5.5也进行了全面升级。例如,通过自适应快慢思考合一技术,模型能够根据问题的难易程度智能切换思考模式,简单问题迅速响应,复杂问题则进行深入分析,整体推理效率提升了8倍。盘古深度研究工具DeepDiver凭借长链难题合成与渐进式奖励等关键技术,在网页搜索、常识性问答等应用场景中表现出色,能够在极短时间内完成复杂问答与专业报告的生成,极大提升了工作效率。
张平安在会上还分享了盘古大模型在计算机视觉CV、预测、多模态以及科学计算等其他基础模型上的技术进展。他指出,盘古大模型不仅在技术上取得了突破,更在农业、工业、科研等多个领域实现了丰富的创新应用和落地实践,为行业难题提供了切实可行的解决方案,成为了推动行业AI发展的先锋力量。