ITBear旗下自媒体矩阵:

百度文心大模型4.5系列开源,10款模型及API服务重磅上线

   时间:2025-07-02 03:00:56 来源:量子位编辑:快讯团队 IP:北京 发表评论无障碍通道

百度今日正式对外宣布,其文心大模型4.5系列已如期实现开源,并同步提供API服务,这一举措标志着百度在AI领域的又一重大突破。

本次开源,百度一次性推出了涵盖多种任务需求的10款模型,参数规模从轻量级的0.3B稠密型模型到47B参数的混合专家(MoE)模型不等,覆盖了文本处理和多模态应用等多个领域。开发者们可以通过飞桨星河社区、HuggingFace以及百度智能云千帆平台直接下载使用这些模型。

值得注意的是,文心大模型4.5系列的开源遵循Apache 2.0协议,为学术研究和产业应用提供了极大的便利。此次开源不仅包括了模型的权重和代码,还提供了API服务,进一步降低了开发门槛。

在技术层面,文心大模型4.5系列展现出了卓越的性能。针对MoE架构,百度提出了一种创新性的多模态异构模型结构,该结构在保持甚至提升文本任务性能的同时,显著增强了多模态理解能力。这一优越性能得益于多模态混合专家模型预训练、高效训练推理框架以及针对模态的后训练等关键技术。

文心大模型4.5系列均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)高达47%,这一数据充分展示了飞桨框架的高效性和稳定性。

实验结果显示,文心大模型4.5系列在多个文本和多模态基准测试中均达到了业界领先水平。特别是在指令遵循、世界知识记忆、视觉理解和多模态推理等任务上,该系列模型展现出了卓越的性能。在文本模型方面,文心大模型4.5系列在多个主流基准评测中超越了DeepSeek-V3、Qwen3等模型;在多模态模型方面,其基于强大的视觉感知能力和丰富的视觉常识,在多项评测中优于闭源的OpenAI模型。

在轻量模型方面,文心4.5系列同样表现出色。文心4.5-21B-A3B-Base文本模型的效果与同量级的Qwen3相当,而文心4.5-VL-28B-A3B多模态模型在同量级开源模型中更是达到了业界领先水平,甚至能与更大参数的模型如Qwen2.5-VL-32B相媲美。

为了进一步提升开发者的使用体验,百度还同步发布了文心大模型开发套件ERNIEKit和大模型高效部署套件FastDeploy。这两个套件为文心大模型4.5系列及开发者提供了开箱即用的工具和全流程支持,进一步简化了模型的开发和部署过程。

作为国内最早投入AI研发的企业之一,百度在算力、框架、模型到应用的四层布局上构建了显著的AI全栈技术优势。此次文心大模型4.5系列的开源,不仅展示了百度在AI技术上的深厚积累,也为整个行业的发展注入了新的活力。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version