在2025百度世界大会上,一款名为文心大模型5.0的原生全模态大模型正式亮相。这款由百度研发的模型参数量高达2.4万亿,采用创新的原生全模态统一建模技术,能够同时处理文本、图像、音频和视频等多种形式的信息输入与输出,展现了强大的多模态交互能力。
据介绍,文心大模型5.0在基础能力上实现了全面突破。在多模态理解、指令执行、创意内容生成、事实准确性以及智能体规划与工具应用等多个维度,该模型均展现出卓越性能。通过40余项权威基准测试的综合评估,其语言与多模态理解能力已达到国际顶尖水平,与Gemini-2.5-Pro、GPT-5-High等知名模型不相上下;在图像与视频生成领域,其表现更可与垂直领域专业模型比肩。
百度首席技术官王海峰在会上详细阐释了技术路线创新。他指出,不同于传统多模态模型采用的后期融合方式,文心5.0从训练阶段就通过统一的自回归架构实现多模态数据融合。这种原生全模态建模方法,使语言、图像、视频、音频等特征在统一框架下深度交互,真正实现了理解与生成的一体化。
在架构设计方面,该模型依托飞桨深度学习框架,采用超稀疏混合专家架构。这种设计在保持2.4万亿参数规模的同时,将激活参数比例控制在3%以下,既保证了模型的处理能力,又显著提升了推理效率。通过大规模工具环境合成任务轨迹数据,并结合思维链与行动链的端到端强化学习,模型的智能体交互和工具调用能力得到质的提升。
百度创始人李彦宏在演讲中强调,大模型技术正经历快速迭代,其智能水平持续突破边界。他特别指出,模型思考时间的延长、原生全模态的统一以及自我学习能力的进化,标志着人工智能正迈向更具创新性的发展阶段。"智能技术本身就是最大的应用场景,而技术迭代速度将成为决定竞争力的核心要素。"李彦宏表示,百度将持续加大研发投入,推动智能技术边界不断拓展。
值得关注的是,在11月8日公布的LMArena大模型竞技场最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任务评测中取得全球并列第二、中国第一的优异成绩。该模型在创意写作、复杂问题解析等高阶认知任务中表现尤为突出,验证了其在实际应用场景中的强大潜力。
目前,文心大模型5.0 Preview版本已通过文心App向公众开放体验,开发者和企业用户也可通过百度千帆大模型平台调用其API服务。这一举措标志着百度在推动人工智能技术普惠化方面迈出重要一步,为各行业智能化转型提供了强有力的技术支撑。









