近日,一家专注于端侧AI模型研发的北京企业面壁智能,正式开源了其最新成果——MiniCPM-o 4.5模型。这款仅有90亿参数的模型,凭借高密度架构与全模态交互能力,在行业内引发广泛关注。其核心创新在于实现了“全双工交互”技术,使模型能够像人类一样边感知环境边主动回应,为具身智能设备提供了更智能的“大脑”解决方案。
与传统大模型不同,面壁智能从创业初期就聚焦端侧场景。此次发布的MiniCPM-o 4.5,参数规模仅为行业头部模型的1.34%至3.83%,却集成了视觉理解、文档解析、语音交互、声音克隆等全模态能力。据研发团队介绍,该模型突破了传统单工交互的局限,通过全双工技术实现了“边看、边听、主动说”的实时响应能力。例如在视觉场景中,模型可根据画面变化自主判断交互时机,无需等待用户指令即可输出信息,大幅降低了对话延迟。
技术负责人姚远用对讲机与电话的比喻解释技术差异:“传统模型如同对讲机,说话时无法接收信息,而全双工模型则像电话,实现了输入输出的并行处理。”这种能力在具身机器人领域具有颠覆性意义。当前行业多聚焦运动控制与视觉-语言-动作(VLA)模型,但缺乏环境感知与主动交互能力。MiniCPM-o 4.5的加入,有望补齐机器人“理解-沟通-响应”的关键能力链。
公司CEO李大海将该模型视为技术范式升级的标志性产品。他指出,现有智能设备多为被动响应模式,而具备环境感知能力的主动式智能将催生全新应用场景。以汽车为例,搭载该模型的车辆可实时理解驾驶员状态与路况变化,提供更精准的交互服务。这种转变不仅需要模型具备多模态处理能力,更要求在算力受限的端侧设备上实现高效运行。
支撑这种技术突破的,是面壁智能独创的“密度法则”。该理论由首席科学家刘知远提出,核心观点是模型能力密度每100天就会翻倍增长。基于此,团队通过持续优化算法架构,在极小参数规模下实现了性能跃升。李大海形象地将这种技术路线比作“大模型的光刻机”:“就像芯片制造追求晶体管密度,我们致力于在有限算力下压缩更多智能。”
在商业化落地方面,面壁智能已与多家车企达成合作。联合创始人雷升涛透露,团队曾将车载遗留物品提醒功能的响应时间从4秒压缩至1秒以内,这种极致优化正是端侧模型的核心竞争力。他强调,端侧场景对算力、内存的严苛约束,反而成为推动技术突破的动力源。当前模型已在汽车、手机等终端设备上实现稳定运行,验证了技术路线的可行性。
对于AI技术演进方向,刘知远认为将呈现两大趋势:一是专业能力持续强化,智能体将具备自主探索与跨领域协作能力;二是模型密度不断提升,最终实现终端设备的普惠化部署。他预测,未来三到五年内,个人专属模型将成为现实,这些具备自主学习能力的智能体将深度融入日常生活,成为真正的个性化助手。











