在2025百度世界大会上,一款备受瞩目的原生全模态大模型——文心大模型5.0正式登场。这款由百度自主研发的模型,凭借其强大的技术实力和卓越的性能表现,迅速成为全场焦点。
文心大模型5.0的参数量高达2.4万亿,采用了原生全模态统一建模技术,实现了全模态理解与生成能力的全面突破。无论是文本、图像、音频还是视频,该模型都能轻松应对,实现多种信息的输入与输出。这一技术革新,使得文心5.0在多模态处理领域占据了领先地位。
在基础能力方面,文心5.0进行了全面升级。它在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等多个方面表现出色,拥有强大的理解、逻辑、记忆和说服力。在40余项权威基准的综合评测中,文心5.0的语言与多模态理解能力与Gemini-2.5-Pro、GPT-5-High等国际顶尖模型不相上下,图像与视频生成能力更是与垂直领域专精模型相当,达到了全球领先水平。
百度首席技术官王海峰在会上详细介绍了文心5.0的技术路线。他指出,与业界多数多模态模型采用的后期融合方式不同,文心5.0采用了统一的自回归架构进行原生全模态建模,实现了理解与生成的一体化。从训练开始,文心5.0就融合了语言、图像、视频、音频等多模态数据,使得多模态特征在统一架构下充分融合并协同优化,从而实现了原生的全模态统一理解与生成。
依托飞桨深度学习框架,文心5.0还采用了超稀疏混合专家架构,进行庞大的全模态训练。尽管总参数规模超过2.4万亿,但激活参数比例却低于3%,这既保证了模型的强大能力,又有效提升了推理效率。同时,基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。
百度创始人李彦宏在会上表示,大模型技术正在快速迭代,其智能水平不断突破极限。模型思考时间变长,原生全模态统一,将具备自我学习和迭代的能力,甚至拥有创新能力。他强调,智能本身是最大的应用,而技术迭代速度是唯一的护城河。百度将持续投入研发,推高智能天花板。
值得一提的是,在11月8日的LMArena大模型竞技场最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任务评测中位列全球并列第二、中国第一,尤其在创意写作、复杂问题理解等方面表现突出。这一成绩再次证明了文心大模型5.0的强大实力。
目前,文心大模型5.0 Preview已同步上线文心App,用户可直接体验其强大功能。同时,开发者和企业用户也可通过百度千帆大模型平台,调用文心大模型5.0的API服务,进一步拓展其应用场景和商业价值。









