ITBear旗下自媒体矩阵:

36天再推新!小米MiMo-V2.5系列大模型亮相,AI赛道加速狂飙

   时间:2026-04-23 20:52:08 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

小米再次在大模型领域掀起波澜。继上月发布三款自研大模型后,这家科技巨头于近日深夜正式推出新一代MiMo-V2.5系列,包含四款不同定位的模型:旗舰版MiMo-V2.5-Pro、通用版MiMo-V2.5,以及专注语音合成的V2.5-TTS Series和语音识别的V2.5-ASR。其中前两款模型将于近期面向全球开发者开源,后两者则进入最终测试阶段。

新系列被定义为"智能体时代全栈解决方案",构建了覆盖推理、多模态交互与语音处理的完整技术矩阵。旗舰型号MiMo-V2.5-Pro专为复杂智能体任务设计,在内部测试中展现出惊人能力:配合特定运行框架可稳定处理近千轮工具调用的超长任务,在保持逻辑连贯性的同时精准捕捉上下文隐含要求。该模型在AI编程智能体基准测试SWE-Bench Pro中取得57.2分,与行业顶尖模型Claude Opus 4.6仅相差0.1分;在小米自研的MiMo Coding Bench评测中,其得分从上一代的71.5分提升至73.7分,逐步缩小与头部模型的差距。

技术团队披露的实战案例更具说服力。在实现完整SysY编译器的挑战中,V2.5-Pro仅用4.3小时完成672次工具调用,在隐藏测试集取得满分成绩,而人类开发者通常需要数周时间。另一个独立开发Web视频编辑器的任务中,该模型通过1868次工具调用构建出包含多轨道时间线、片段裁剪等功能的完整应用,最终生成8192行代码。这些突破标志着长程任务处理能力发生质变,为智能体落地复杂应用场景奠定基础。

通用型号MiMo-V2.5则聚焦多模态交互场景,支持视觉、听觉与文本信息的一体化处理,上下文窗口扩展至100万Token。相较于Pro版本,其平均推理速度提升30%,更适合对响应延迟敏感的实时交互场景。在评估智能体解决现实问题能力的Claw-eval多模态评测中,该模型取得23.8分,较前代提升50%。

成本优化成为新系列另一大亮点。通过深度优化Token利用率,V2.5-Pro在相同评测分数下较Kimi K2.6节省42%计算资源,V2.5较Muse Spark节省50%。配套的定价体系同步调整:取消复杂计费模式,推出"连续包月/包年"订阅方案,并在每日零点至八点提供八折优惠。不同版本采用差异化消耗倍率,通用版保持1倍基准,旗舰版设定为2倍,整体使用成本显著下降。

这种快速迭代能力源于小米对AI的战略级投入。公司创始人雷军今年3月宣布,未来三年将投入超600亿元用于AI技术研发,为模型训练提供充足算力支持。大模型团队负责人罗福莉指出,行业正经历从"对话交互"到"智能体范式"的剧烈转变,小米需要抓住移动端智能体赛道的关键窗口期。

终端生态的协同效应开始显现。小米澎湃OS 3 Beta版已向部分机型推送"龙虾"智能体Xiaomi miclaw,新增人格体系、技能体系与跨设备同步功能,支持80余项系统工具调用。这种模型能力与终端体验的双向促进,正在形成独特的竞争优势——更强大的模型支撑更智能的终端服务,海量终端数据反哺模型持续优化。随着600亿投入逐步落地,小米的"月更模式"或许将重塑行业技术迭代节奏。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version