近日,面壁智能公司宣布了一项重大进展,正式开源了其最新的MiniCPM-V 4.0模型。据官方介绍,该模型在图像理解领域的能力已经超越了GPT-4.1-mini-20250414,这一突破引发了业界的广泛关注。
MiniCPM-V 4.0不仅继承了前代版本MiniCPM-V 2.6的诸多实用功能,还在推理效率上实现了显著提升。面壁智能公司表示,这一改进使得MiniCPM-V 4.0在处理复杂图像理解任务时更加游刃有余。
在OpenCompass评测中,MiniCPM-V 4.0的图像理解能力得到了充分验证。它不仅超越了GPT-4.1-mini-20250414,还超过了Qwen2.5-VL-3B-Instruct和InternVL2.5-8B等其他知名模型。这一成绩充分证明了MiniCPM-V 4.0在图像理解领域的领先地位。
MiniCPM-V 4.0的参数总量仅为4B,这在大型语言模型中算是相对小巧的。面壁智能公司认为,这一小巧的参数规模和高效的架构使得MiniCPM-V 4.0成为移动端部署的理想选择。事实上,该公司已经同步开源了适用于iPhone和iPad的iOS应用,用户在iPhone 16 Pro Max等设备上使用时,可以体验到首token延迟低于2秒、解码速度超过17 token/s的流畅体验。
面壁智能公司对于MiniCPM-V 4.0的开源表示出极大的信心。他们认为,这一模型的推出将进一步推动图像理解技术的发展,并为更多开发者提供强大的工具支持。同时,他们也期待看到更多基于MiniCPM-V 4.0的创新应用出现。
对于有兴趣了解或尝试MiniCPM-V 4.0的开发者来说,可以通过面壁智能公司提供的开源地址获取相关信息和资源。这一举措无疑将为图像理解领域的发展注入新的活力。