ITBear旗下自媒体矩阵:

小米MiMo大模型三连更!多模态交互升级,还能免费体验智能体“养虾”

   时间:2026-03-19 07:50:26 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

小米公司近日宣布推出三款全新大模型,分别为旗舰基座模型MiMo-V2-Pro、全模态交互模型MiMo-V2-Omni以及语音合成模型MiMo-V2-TTS。这三款模型均针对智能体能力优化设计,标志着小米在人工智能领域的技术突破。

旗舰基座模型MiMo-V2-Pro总参数量超过1万亿,激活参数量达420亿,支持100万上下文长度。该模型在编程智能、通用智能体和工具使用方面表现突出,与Claude Sonnet 4.6、GPT 5.2等国际领先模型性能相近。在OpenClaw标准评测榜单中,MiMo-V2-Pro位列第三,仅次于Claude系列模型。其定价策略具有竞争力,输入价格仅为Claude Opus 4.6的五分之一。

全模态交互模型MiMo-V2-Omni融合文本、视觉、语音三种模态,具备跨模态环境理解能力。该模型在音频理解方面支持环境声分类、多说话人分离等功能,图像理解能力超越Claude Opus 4.6,视频理解表现优于Gemini 3 Flash。在实际应用中,MiMo-V2-Omni可自主完成复杂任务,如通过浏览器进行产品比价、砍价并完成下单流程。该模型支持256K上下文长度,输入价格每百万tokens仅0.4美元。

语音合成模型MiMo-V2-TTS采用小米自研的多码本语音-文本联合建模架构,经过上亿小时语音数据训练。该模型支持多层次语音风格控制,可识别文本中的标点符号、语气词等格式信号,实现自然语音表达。其方言支持范围包括东北话、四川话、粤语等五种主要方言,并能进行角色扮演和歌声合成。这项技术使智能体对话更具情感温度和真实感。

小米同步推出基于MiMo-V2-Pro的智能体体验平台"MiMo Claw",用户可免费体验30分钟智能体服务。该平台已接入金山WebOffice生态,支持Word、Excel等主流文档格式处理。小米浏览器也完成模型接入,实现AI搜索功能升级。这些应用场景展示了小米大模型在办公和日常生活中的实用价值。

技术团队透露,MiMo-V2-Pro和MiMo-V2-Omni的早期测试版曾以Hunter Alpha、Healer Alpha的匿名形式,在全球最大API聚合平台OpenRouter上引发关注。这两个匿名模型连续多日登顶API调用量日榜,其性能表现获得开发者社区认可。OpenClaw创始人Peter Steinberger曾公开询问这两个模型的具体信息,侧面印证了其技术影响力。

在模型性能对比方面,MiMo-V2-Pro在全球权威排行榜Artificial Analysis中位列全球第九、国内第三。该模型在复杂工作流编排、长程规划等Agent核心能力上表现优异,能够无人工干预完成多步骤任务。编程测试显示,其代码风格优雅程度和问题解决效率接近Claude Opus 4.6水平。

小米大模型研发团队由原DeepSeek核心成员罗福莉领衔,团队正致力于攻克高复杂度推理和长周期任务规划等技术难题。通过持续优化长周期智能体规划、实时流式感知等能力,小米计划推动智能体与物理世界的深度整合。这次发布的三款模型形成技术矩阵,涵盖基础能力、多模态交互和语音表达等关键领域。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version