滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

面壁智能MiniCPM-o4.5全模态模型来袭：边感知边对话开启AI新交互

时间：2026-02-06 03:42:01 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当空气炸锅发出“叮”的一声提示音，还没等你反应过来，一个AI声音抢先说道：“好了，它已经叮了。”这不是科幻电影里的场景，而是面壁智能最新开源的全模态模型MiniCPM-o4.5带来的真实体验。这款模型突破了传统AI“一问一答”的交互模式，实现了边看、边听、主动说的全新能力。

在厨房场景中，只需将手机放置一旁，MiniCPM-o4.5就能同时处理视觉和听觉信息。当用户询问水果价格时，模型会结合持续观察的货架变化给出实时回答；在电梯场景中，它能够识别楼层变化并在到达指定楼层时主动提醒。这种持续感知能力使其更像一位随时待命的助手，而非需要反复唤醒的工具。

该模型的核心突破在于引入全双工多模态实时流机制。传统模型采用串行处理方式，必须完成输入接收后才能生成输出，而MiniCPM-o4.5通过并行处理架构，使视频/音频输入流与语音/文本输出流同步运行。这种设计让模型在说话时仍能接收新指令，甚至能被中途打断并即时响应。

技术实现层面，研发团队对模态编码器与解码器进行流式升级，采用文本与语音token交错建模技术提升语音生成稳定性。通过时分复用机制，模型在毫秒级时间线上统一处理多模态信息，实现高效的流式交互。在对话时机判断上，模型以1Hz频率持续进行语义分析，取代了传统的语音静音检测机制。

实际测试中，模型展现出惊人的临场反应能力。当它正在描述画面中的蓝色鸭子时，测试人员突然插入询问黄色鸭子位置的新指令，模型在完成当前句子后立即切换回答。这种即时自由对话能力，标志着AI交互从回合制转向连续实时模式。

在性能基准测试中，仅9B参数规模的MiniCPM-o4.5在全模态理解、视觉解析、语音克隆等多个维度达到行业领先水平。其端到端全模态架构通过稠密特征直接连接各模态组件，使视觉、音频信息在模型生成输出的同时持续更新，这种设计特别适合需要持续感知的场景。

这款模型的推出反映了AI技术的重要转向。传统问答式AI如同对讲机，而MiniCPM-o4.5更像持续运行的智能体，能够在感知环境的同时参与对话。这种特性使其在具身智能、车载助手、复杂系统控制等领域具有独特优势，因为这些场景需要AI在动态环境中做出实时决策。

作为端侧AI的坚定践行者，面壁智能将MiniCPM-o4.5定位为赋能终端的基础模型。公司自2022年成立以来就专注端侧部署，与芯片厂商建立深度协同机制，在模型训练阶段即针对端侧芯片进行优化。这种软硬一体化的研发模式，解决了隐私保护、延迟控制等云端方案难以克服的痛点。

据透露，该模型将与面壁计划年中发布的AI开发板松果派配套推出，实现开箱即用的端侧智能硬件开发。这种模型与硬件的深度适配策略，旨在打通端侧AI落地的最后一公里。面对日益激烈的端侧市场竞争，面壁智能强调其差异化战略：专注于端侧领域并将技术做到极致。

当前，手机、汽车、机器人等终端设备对大模型的需求已从质疑转向共识。MiniCPM-o4.5的发布展示了端侧AI的新可能——通过持续感知与实时交互，让智能助手真正融入现实世界的连续时空。这种技术演进不仅改变了人机交互方式，更为AI在物理世界的深度应用开辟了新路径。

相关资源已通过多个平台开放：GitHub开源代码库、HuggingFace模型空间及ModelScope模型库均提供完整技术文档。开发者可通过专属体验链接测试全双工模式与图文对话功能，亲身感受下一代AI交互方式的革新。

更多>同类资讯

试验三十号03、04星成功入轨航天与数字化融合再创新高

这一消息迅速成为全网热点，不仅展现了我国强大的航天实力，更体现出数字化、物联网、数据采集与自动识别技术在现代航天领域的关键作用。在发射全过程中，物联网与智能监测系统实现了对火箭、卫星状态的实时跟踪。从成功发…

03-17

厦门大寻网络：以技术创新破解物联网开发难题，赋能行业智能化升级

数据显示，超过65%的物联网项目因设备协议不兼容导致开发周期延长30%以上（IDC 2023年报告），而实时数据处理延迟超过200ms将直接影响工业自动化场景的良品率（测试显示某汽车制造企业案例）。平台内置的…

03-17

蚂蚁灵波科技携手乐聚机器人，共探具身智能场景落地新路径

双方将充分发挥各自在具身智能大模型与机器人本体技术领域的优势，围绕工业、商业场景展开深度协同，形成“本体+数据+模型”协同创新示范，加速推动具身智能机器人迈向通用智能。接下来，双方将依托蚂蚁灵波在具身大模型…

03-17

英国两兄弟携手打造魔方机器人，45.3秒复原四阶魔方创世界纪录

兄弟俩设计的机器人在 45.3 秒内复原了一个四阶魔方，这一成绩获得吉尼斯世界纪录认证，也打破了一项保持十多年的旧纪录。 IT之家从报道中获悉，实际上，这个项目最初只是两人在布里斯托大学读书时的一个课程项目…

03-16

美银预测：2060年全球人形机器人或达30亿台未来五年出货增速迅猛

在进入家庭之前，人形机器人首先会在工业领域普及。美国银行承认，从今天 3.5 万美元（现汇率约合 24.2 万元人民币）的工业机器人到未来30 亿台机器人的世界，中间仍存在大量技术、监管和经济挑战，任何…

03-16

上汽大众ID. ERA技术发布会启幕 “人本科技”领航九大黑科技赋能智能出行

03-16

AI时代：公司数量或减，个人能力放大，你准备好做破局者了吗？

很多年轻人担心的是：AI会不会把工作都抢走。但更真实的情况是：AI淘汰的往往不是人，而是效率低的组织结构。所以未来的趋势，很可能是：公司数量减少，但个人能力放大。 Sam Altman 曾经说过一句很有意…

03-16

OpenAI联合创始人：年薪超10万美金的职业最易被AI取代

03-16

消息称前金立副总裁俞雷加盟MOVA，任手机业务负责人

03-16

逆天改道！中国AI大模型周调用量连超美国，神秘“独角兽”Hunter Alpha暴力刷榜

03-16

蚂蚁灵波与乐聚达成战略合作，推进“一脑多机”应用落地

03-16

高效轻量化：IBM 发布 Granite 4.0 1B Speech 多模态语音大模型

03-16

上海发布生成式 AI 服务备案公告：全市累计备案模型达 150 款

03-16

视频号要有对手了？OpenAI 计划将 Sora 接入 ChatGPT：Disney 角色或成付费杀手锏

03-16

中国AI大模型周调用量连超美国，新锐力量Hunter Alpha强势崛起引关注

03-16

点击查看更多 +

全站最新

小米新一代SU7 3月19日发布，配置升级，能否助力小米完成2026年销量目标？

问界M7夜紫配色3月23日亮相华为新品发布会多款重磅新品齐登场

科大讯飞Pokee SE录音笔：轻巧续航强，快速传输智能降噪，多场景适用之选

职场效率新宠：科大讯飞智能办公本X3Pro，语音转写与书写体验双升级

公告精选︱协创数据：2025年净利润同比增长68.32% 拟10股转4股派3.4元

只定制，不复制丨招商海晏府多元美学跨界盛典圆满落幕

热门内容

本栏最新

上汽大众ID. ERA技术发布会启幕 “人本科技”领航九大黑科技赋能智能出行

AI时代：公司数量或减，个人能力放大，你准备好做破局者了吗？

复杂声学挑战迎刃而解北京奥音贝赋能机器人语音交互新突破

CES Asia 2026启幕在即：华为三星领衔，具身智能全产业链共赴盛会

安卓RK3588平台助力AI数字人交互系统，破解企业智能化服务难题

智器时代浪潮下：人类角色转变与商业赛道新博弈

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

面壁智能MiniCPM-o4.5全模态模型来袭：边感知边对话 开启AI新交互

面壁智能MiniCPM-o4.5全模态模型来袭：边感知边对话开启AI新交互