百度今日正式对外宣布,其文心大模型4.5系列已如期实现开源,并同步推出了API服务。此次开源行动,百度一次性推出了涵盖多个任务需求的10款开源模型,参数规模从轻量级的0.3B稠密型模型到47B参数的混合专家(MoE)模型不等。
百度文心大模型4.5系列的此次开源,不仅包括了模型权重和代码的完全开放,还提供了便捷的API接口,开发者可以通过飞桨星河社区、HuggingFace以及百度智能云千帆平台直接下载并使用这些模型。值得注意的是,此次开源遵循的是Apache 2.0协议,为学术研究和产业应用提供了广阔的空间。
在文心大模型4.5系列中,百度创新性地提出了一种多模态异构模型结构,特别适用于从大语言模型向多模态模型的持续预训练。这种结构在保持文本任务性能的同时,显著增强了多模态理解能力,得益于多模态混合专家模型预训练、高效训练推理框架以及针对模态的后训练等关键技术。
文心大模型4.5系列均基于飞桨深度学习框架进行训练、推理和部署,其在大语言模型预训练中的模型FLOPs利用率(MFU)达到了47%,显示出高效的计算性能。实验结果显示,这些模型在多个文本和多模态基准测试中均达到了业界领先水平,特别是在指令遵循、世界知识记忆、视觉理解和多模态推理任务上表现突出。
在文本模型方面,文心大模型4.5系列在多个主流基准评测中超越了其他知名模型,如DeepSeek-V3和Qwen3。而在多模态模型领域,基于强大的视觉感知能力和丰富的视觉常识,文心大模型4.5系列在视觉常识、多模态推理、视觉感知等评测中优于闭源的OpenAI模型。在轻量级模型上,文心大模型4.5系列也展现出了卓越的性能,与同级别的开源模型相比毫不逊色。
作为国内AI领域的先行者,百度在算力、框架、模型到应用的全栈布局上构建了显著的技术优势。飞桨作为中国首个自主研发的产业级深度学习平台,为文心大模型4.5系列的开源提供了强有力的支持。此次开源,百度还同步升级发布了文心大模型开发套件ERNIEKit和大模型高效部署套件FastDeploy,为开发者提供了从模型开发到部署的全流程支持,大大降低了模型应用的门槛。
文心大模型4.5系列的开源,标志着百度在框架层和模型层均实现了“双层开源”。这一举措不仅将进一步推动AI技术的普及和应用,也将为AI领域的创新和发展注入新的活力。