在上海举办的百度文心Moment大会上,文心大模型5.0正式版正式亮相。这一版本拥有高达2.4万亿的参数规模,采用原生全模态统一建模技术,能够同时处理文本、图像、音频和视频等多种类型的信息输入与输出,展现出强大的全模态理解与生成能力。
在权威基准的综合评测中,文心5.0正式版表现卓越。其语言与多模态理解能力稳居国际领先行列,图像与视频生成能力则与垂直领域的专业模型不相上下,整体技术处于全球前沿水平。这一成绩的取得,得益于其独特的技术路线和创新架构。
与业界普遍采用的“后期融合”多模态方案不同,文心5.0采用了统一的自回归架构进行原生全模态建模。它将文本、图像、视频、音频等多源数据在同一模型框架内进行联合训练,使多模态特征在统一架构下深度融合并协同优化,从而实现了原生的全模态统一理解与生成。这种技术路线不仅提升了模型的性能,还为多模态人工智能的发展开辟了新的路径。
文心5.0还引入了超大规模混合专家结构,具备超稀疏激活参数特性。其激活参数比低于3%,在保持模型强大能力的同时,显著提高了推理效率。这一创新设计使得文心5.0在处理复杂任务时更加高效,为用户提供了更流畅的体验。
得益于原生全模态建模技术,文心5.0在多模理解、代码生成和创意写作等领域实现了显著突破。无论是理解复杂的图像和视频内容,还是生成高质量的代码和创意文本,文心5.0都展现出了卓越的能力。这些突破不仅提升了模型的应用价值,也为相关领域的发展注入了新的活力。
目前,用户可以通过文心APP和文心一言官网体验文心5.0的强大功能,企业与开发者则可通过百度千帆平台进行调用,满足多样化的业务需求。














