在2025百度世界大会的现场,百度公司重磅推出新一代原生全模态大模型——文心大模型5.0。这款采用统一自回归架构的模型,通过原生全模态建模技术实现了文本、图像、音频、视频等多模态数据的深度融合,参数量达到2.4万亿级别,标志着我国人工智能技术迈入全新发展阶段。
据技术团队介绍,文心5.0突破传统多模态模型后期融合的技术路径,从训练阶段便实现语言、视觉、听觉等多维度数据的原生融合。这种创新架构使得模型在理解复杂信息时,能够同步调动不同模态的特征进行协同优化,最终形成统一的多模态表征体系。在权威基准测试中,该模型的语言理解能力与Gemini-2.5-Pro、GPT-5-High等国际顶尖模型持平,图像视频生成质量达到垂直领域专业模型水准。
百度首席技术官王海峰在技术解读环节指出,原生全模态架构的优势在于实现理解与生成的深度耦合。通过统一的自回归机制,模型不仅能够精准解析多模态输入,更能生成符合逻辑的多模态输出,这种技术突破为智能体规划、工具调用等复杂应用场景提供了坚实基础。
在应用层面,文心5.0展现出全方位的能力提升。测试数据显示,模型在指令遵循准确率、创意写作质量、事实核查精度等40余项核心指标上均有显著突破。特别是在跨模态任务处理中,其智能体规划能力较前代提升37%,工具调用成功率达到92%,展现出强大的环境适应与问题解决能力。
百度创始人李彦宏在主题演讲中强调,智能技术的进化正在突破传统边界。他指出:"当前大模型的发展已进入智能跃迁期,模型不仅具备更长的思考链,更能通过自我迭代实现能力进化。这种持续突破的创新能力,正是构建技术壁垒的核心要素。"
在生态建设方面,百度同步推出文心大模型5.0 Preview版本。个人用户可通过文心App直接体验最新功能,开发者和企业客户则能借助千帆大模型平台调用API服务。值得关注的是,在11月8日发布的LMArena大模型竞技场排名中,文心ERNIE-5.0-Preview-1022在文本任务评测中取得全球并列第二、国内第一的优异成绩,尤其在复杂逻辑推理和创意内容生成领域表现突出。
行业分析人士认为,文心5.0的推出标志着我国在多模态大模型领域实现关键技术突破。其原生全模态架构不仅解决了传统模型的信息割裂问题,更为智能体、数字人等前沿应用提供了更强大的技术支撑,有望推动人工智能技术向通用智能方向加速演进。





