面壁智能携手清华大学及OpenBMB开源社区,共同推出并开源了新一代端侧文本基座大模型——MiniCPM5-1B。这款模型凭借其1B的参数规模,在国际权威榜单AA-Index(Artificial Analysis Intelligence Index)上脱颖而出,超越了所有2B参数以下的同类模型。
相较于三个月前发布的Qwen3.5-2B,MiniCPM5-1B不仅在性能上有了显著提升,参数量更是减少了一半。这一突破性的成果,得益于面壁智能自主研发的AI训练框架ForgeTrain,该框架为Base Model版本的预训练提供了强有力的支持。
MiniCPM5-1B在INT4量化后,其权重仅占0.5GB,这使得它能够轻松运行在智能手机和浏览器等端侧设备上。这一特性极大地拓宽了模型的应用场景,为移动端AI应用的发展注入了新的活力。
为了推动AI技术的普及与发展,面壁智能决定将MiniCPM5-1B全面开源。此次开源的内容不仅包括模型权重,还涵盖了训练数据集和部署方案,为开发者提供了完整的开发环境。开发者们可以通过HuggingFace、GitHub、ModelScope、GitCode以及魔乐社区等多个平台获取相关资源,进一步推动AI技术的创新与应用。
具体开源链接如下:HuggingFace平台(https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B)、GitHub仓库(https://github.com/OpenBMB/MiniCPM)、ModelScope模型库(https://modelscope.cn/models/OpenBMB/MiniCPM5-1B)、GitCode代码托管平台(https://ai.gitcode.com/OpenBMB/MiniCPM5-1B)以及魔乐社区(https://modelers.cn/models/OpenBMB/MiniCPM5-1B)。









