在华为开发者大会HDC 2025的精彩时刻,华为云计算的掌舵人张平安,同时也是华为的常务董事,向与会者隆重介绍了盘古大模型5.5版本。此次升级涵盖了自然语言处理(NLP)、计算机视觉(CV)、多模态、预测以及科学计算五大核心领域,每一项都实现了显著的技术飞跃。
在NLP方面,盘古大模型推出了一个史无前例的718B深度思考模型,这一模型由256位专家组成的MoE架构支撑,尤其在知识推理、工具调用及数学领域展现出了卓越的能力。值得注意的是,这一大模型是在昇腾云的全栈软硬件环境下训练而成,标志着昇腾架构在打造世界级大模型方面的雄厚实力。
盘古5.5版本在用户体验上也进行了全面优化,特别是在高效长序列处理、低幻觉生成、快慢思考融合及Agent特性上。例如,通过创新的自适应快慢思考合一技术,盘古能够根据问题的难易程度智能切换思考模式,简单问题迅速响应,复杂问题则进行深入思考,整体推理效率提升了8倍。其深度研究工具DeepDiver能够在网页搜索和常识性问答等应用中展现高效执行,5分钟内即可完成复杂多跳问答,生成万字专业报告,极大地提升了工作效率。
在预测领域,盘古大模型引入了业界首创的triplet transformer统一预训练架构,这一架构能够高效处理不同行业的数据,包括表格数据、时间序列数据和图片数据,通过三元组编码实现跨行业、跨场景的泛化应用,显著提升了预测精度。
科学计算方面,盘古大模型的应用也在不断拓展。深圳气象局利用盘古升级了“智霁”大模型,实现了AI集合预报,提高了天气系统演变可能性的预测准确性。重庆市气象局则针对成渝地区的降水特点,基于盘古打造了“天资・12h”气象大模型,提升了灾害天气的日内预报预警能力。深圳能源则采用盘古进行中短期风光水发电量预测,有效减少了发电侧的弃电现象,提升了能源开发效率。
在计算机视觉领域,华为云推出了全新MoE架构的300亿参数视觉大模型,这是目前业界最大的视觉模型,支持包括图像、红外、激光点云、光谱、雷达等多维度泛视觉感知、分析与决策。盘古CV大模型还通过跨维度生成模型,构建了油气、交通、煤矿等工业场景的稀缺泛视觉故障样本库,极大地提升了业务场景的可识别种类与精度。
多模态方面,盘古大模型推出了全新的世界模型,这一模型能够为智能驾驶和具身智能机器人的训练构建所需的数字物理空间,实现持续优化迭代。在智能驾驶领域,通过输入行车场景、行车控制信息和路网数据,盘古世界模型就能生成每路摄像头的行车视频和激光雷达的点云,为智能驾驶提供了大量训练数据,降低了对高成本路采的依赖。
盘古大模型5.5版本的发布,不仅标志着华为在AI技术领域的又一次重大突破,也为各行各业的数字化转型提供了强大的技术支持,预示着一个更加智能、高效的未来正在加速到来。