在2025百度世界大会上,百度正式推出其最新力作——原生全模态大模型文心大模型5.0。这款模型以其高达2.4万亿的参数量和原生全模态统一建模技术,成为行业瞩目的焦点。它不仅能够理解文本、图像、音频和视频等多种信息,还能实现这些模态的生成,为用户提供全方位的智能体验。

文心大模型5.0在基础能力上实现了全面升级,尤其在多模态理解、指令遵循、创意写作、事实性以及智能体规划与工具应用方面表现卓越。经过40余项权威基准的综合评测,该模型的语言与多模态理解能力与Gemini-2.5-Pro、GPT-5-High等国际顶尖模型不相上下,图像与视频生成能力更是与垂直领域的专精模型相当,展现了其全球领先的技术水平。
百度创始人李彦宏在大会上强调,大模型技术正处于快速迭代阶段,其智能水平不断突破极限。他指出,随着模型思考时间的延长和原生全模态的统一,大模型将具备自我学习和迭代的能力,甚至能够创新。李彦宏表示,智能本身是最大的应用,而技术迭代的速度则是百度构建护城河的关键。百度将持续投入研发,推动智能技术的不断进步。
百度首席技术官王海峰进一步介绍了文心大模型5.0的技术特点。他表示,与业界多数采用后期融合方式的多模态模型不同,文心5.0采用了统一的自回归架构进行原生全模态建模,实现了理解与生成的一体化。这种技术路线从训练阶段便融合了语言、图像、视频、音频等多模态数据,使得多模态特征在统一架构下充分融合并协同优化,从而实现了原生的全模态统一理解与生成。

依托飞桨深度学习框架,文心大模型5.0采用了超稀疏混合专家架构进行全模态训练,总参数规模超过2.4万亿,但激活参数比例低于3%。这一设计在保持模型强大能力的同时,有效提升了推理效率。该模型还基于大规模工具环境合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。
目前,文心大模型5.0 Preview已同步上线文心App,用户可以直接体验其强大的功能。同时,开发者和企业用户也可以通过百度千帆大模型平台调用文心大模型5.0的API服务,进一步拓展其应用场景。
值得一提的是,在11月8日公布的LMArena大模型竞技场最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任务评测中位列全球并列第二、中国第一,尤其在创意写作和复杂问题理解方面表现尤为突出,再次证明了百度在大模型领域的领先地位。









