在华为开发者大会HDC2025的盛会上,华为云计算迎来了一个重要时刻。华为常务董事及云计算业务首席执行官张平安,向与会者隆重推介了盘古大模型的最新版本——5.5版。此次升级涵盖了自然语言理解NLP、计算机视觉CV、预测、多模态以及科学计算五大核心领域,为各行各业带来了前所未有的价值提升。
张平安强调,盘古大模型5.5是基于昇腾云的全栈软硬件环境精心训练而成,这一成就标志着昇腾架构在打造世界级大模型方面的卓越能力。
在自然语言处理方面,盘古大模型5.5引入了全新的718B深度思考模型,这一模型由256个专家系统组成的MoE(混合专家)架构支撑,显著增强了知识推理、工具调用及数学处理等方面的能力,实现了行业领先地位。通过一系列创新算法,如通算掩盖、全局动态均衡以及分组混合专家MoGE等,盘古大模型实现了与昇腾硬件的高度亲和,从而在训练和推理效率上均达到了业界顶尖水平。通过模型亲和词表、三明治架构及EP-Group负载均衡loss等技术的引入,盘古大模型在与业界一流模型的竞争中展现出了强大的竞争力。
在用户体验方面,盘古大模型5.5也进行了全面升级。例如,通过自适应快慢思考合一技术,模型能够根据问题的难易程度灵活切换思考模式,对于简单问题能够迅速回应,而对于复杂问题则能够进行深度思考。这一技术使得整体模型的推理效率提升了8倍。盘古深度研究DeepDiver通过一系列关键技术,如长链难题合成和渐进式奖励等,在网页搜索、常识性问答等应用场景中展现出了极高的执行效率。例如,它能够在5分钟内完成超过10跳的复杂问答,并生成万字以上的专业调研报告,极大地提升了工作效率。
张平安在会上还分享了盘古大模型在计算机视觉CV、预测、多模态以及科学计算等其他基础模型方面的技术升级。同时,他还展示了盘古大模型在农业、工业、科研等多个领域的创新应用和落地实践。这些丰富的应用场景不仅展示了盘古大模型的广泛适用性,也彰显了华为在推动行业AI发展方面的领先地位。