在2025百度世界大会上,百度宣布推出新一代原生全模态大模型——文心大模型5.0。这款模型参数量高达2.4万亿,采用原生全模态统一建模技术,能够同时处理文本、图像、音频、视频等多种信息输入与输出,实现了全模态理解与生成能力的突破。
据介绍,文心大模型5.0在基础能力上实现了全面升级。在多模态理解、指令遵循、创意写作、事实性核查、智能体规划与工具应用等多个维度,该模型均展现出卓越性能。在40余项权威基准测试中,其语言与多模态理解能力与Gemini-2.5-Pro、GPT-5-High等国际顶尖模型持平,图像与视频生成能力则达到垂直领域专精模型水平,跻身全球领先行列。
百度首席技术官王海峰详细解释了技术路线创新。他表示,不同于传统多模态模型采用的后期融合方式,文心5.0从训练阶段就通过统一的自回归架构实现原生全模态建模,将语言、图像、视频、音频等多模态数据深度融合。这种设计使多模态特征在统一框架下充分交互优化,真正实现了原生的全模态统一理解与生成。
在架构设计上,文心5.0依托飞桨深度学习框架,采用超稀疏混合专家架构。尽管总参数规模超过2.4万亿,但激活参数比例控制在3%以下,既保证了模型强大能力,又显著提升了推理效率。同时,通过大规模工具环境合成复杂任务轨迹数据,结合思维链与行动链的端到端强化学习训练,模型在智能体交互和工具调用方面的能力得到质的提升。
百度创始人李彦宏在会上强调,大模型技术正经历快速迭代,其智能水平持续突破极限。他指出:"当前模型不仅思考时间延长,更实现了原生全模态统一,具备自我学习和迭代创新能力。智能本身已成为最大的应用场景,而技术迭代速度将是决定竞争力的关键因素。"百度承诺将持续投入资源,推动模型技术向更高智能水平发展。
在应用落地方面,文心大模型5.0 Preview版本已同步上线文心App,普通用户可直接体验其强大功能。同时,开发者和企业用户可通过百度千帆大模型平台调用API服务,快速集成到各类应用场景中。值得关注的是,在11月8日公布的LMArena大模型竞技场最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任务评测中取得全球并列第二、中国第一的优异成绩,尤其在创意写作和复杂问题理解方面表现突出。









