近日,一款代号为“Hunter Alpha”的神秘大模型在全球最大API聚合平台OpenRouter上引发广泛关注,其曾一度登顶大模型调用榜,引发外界对“DeepSeek V4早期版本”的猜测。如今,这一悬念终于揭晓——小米正式宣布认领该模型,并同步推出三款全新大模型:MiMo-V2-Pro、MiMo-V2-Omni与MiMo-V2-TTS,用户可限时免费体验一周。
作为旗舰基座模型,Xiaomi MiMo-V2-Pro以超1T的总参数量(42B激活参数)和混合注意力架构为核心,支持1M上下文长度处理。在Artificial Analysis排行榜中,该模型位列全球第八、国内第二,性能表现亮眼。在智能体框架应用中,其整体体验已超越Claude Sonnet 4.6,接近Opus 4.6水平,而API定价仅为后者的五分之一。目前,MiMo-V2-Pro已开放API服务,采用阶梯式计费模式,满足不同规模需求。
针对多模态交互场景,小米推出的MiMo-V2-Omni模型展现出强大实力。在音频理解领域,该模型支持环境声分类、多说话人分离及超10小时长音频深度解析,综合表现优于Gemini 3 Pro,成为当前音频理解领域的标杆之一。图像理解方面,其多学科视觉推理与复杂图表分析能力超越Claude Opus 4.6,逼近Gemini 3 Pro等顶尖闭源模型。MiMo-V2-Omni还支持原生音视频联合输入,实现跨模态视频内容理解。
语音合成领域,Xiaomi MiMo-V2-TTS基于自研Audio Tokenizer与多码本语音-文本联合建模架构,突破传统模型局限。该模型可实现单句内语气转折与情感递变,精准还原人类自然韵律,甚至在歌唱场景中能准确表达音高与节奏。更引人注目的是,其支持东北话、四川话、粤语等十余种方言发音,并可进行角色化风格演绎,为语音交互增添更多可能性。
伴随新模型发布,小米同步上线MiMo Studio官网及MiMo Claw工具。该工具集成最新模型能力,提供WebOffice在线文档预览功能,并支持一键部署OpenClaw框架。用户可免费体验30分钟,利用其内置文件系统实现网站内容抓取、文档修改等操作,体验“零成本”智能办公新方式。











