ITBear旗下自媒体矩阵:

DeepSeek发布在即,小米Mimo-V2.5系列开启公测,罗福莉带队

   时间:2026-04-23 14:38:01 来源:鞭牛士编辑:快讯 IP:北京 发表评论无障碍通道
 

AIPress.com.cn报道

4月23日,小米Mimo研究所发文宣布,小米MiMo-V2.5-Pro及MiMo-V2.5模型开启公测,并即将开源,还有语音合成和语音识别系列紧随其后。

MiMo-V2.5系列,四款模型同时亮相。

带队的人还是罗福莉。

如果你关注AI圈,应该知道这个名字。她是前DeepSeek-V2核心研发成员,业内人称"天才少女"。

有意思的是,就在小米发模型的这个当口,业界盛传DeepSeek V4将于本周发布。

一个前DeepSeek核心成员,带着新东家在最敏感的时间点亮剑了。

一、MiMo-V2.5模型定位专为Agent场景打造

先搞清楚小米这次发了什么。

MiMo-V2.5系列不擅长写朋友圈文案。它的定位极其明确,专为Agent场景打造。

MiMo-V2.5-Pro,小米迄今最强模型,专攻长难Agent任务。在SWE-bench Pro(软件工程)、Claw-eval(智能体评估)、τ3-Bench(长程推理)等基准上,直接对标Claude Opus 4.6和GPT-5.4。

它能稳定完成单次近千轮工具调用的长程任务,在超长周期内保持逻辑一致。

MiMo-V2.5标准版,原生全模态Agent,覆盖图像、音频、视频,平均推理速度比Pro版更快(100-150 tokens/s),适合办公、数据分析等时延敏感场景。

当然了,光说参数没感觉,看三个官方实测:

北大编译原理课程项目:

用Rust从零实现完整SysY编译器,包括词法分析、语法分析、IR生成、RISC-V后端、性能优化。北大本科生通常做数周,MiMo-V2.5-Pro4.3小时、672次工具调用,隐藏测试满分。

视频编辑器Web应用:

多轨道时间线、片段裁剪、交叉淡化、音频混合、导出流程。代码量8192行,11.5小时自主完成,1868次工具调用。

模拟电路EDA设计:

基于台积电180nm工艺设计FVF-LDO稳压器,连接ngspice仿真闭环迭代,约一小时生成满足全部指标的设计,部分指标比初始版本提升一个数量级。

这些任务的核心特征在于:它们重在独立完成项目,绝非简单回答问题。

至于网红问题,50米洗车该走路还是开车,

小米的新模型是这么说的:

二、小米选择的突破口Agent时代的效率优先级

OpenAI强在通用能力和品牌护城河,DeepSeek强在极致性能和开源生态。小米凭什么插一脚?

凭的是Token效率。

在Agent基准Claweval上,MiMo-V2.5-Pro拿到相同分数的情况下,比Kimi本周发布的K2.6省了42% Token;MiMo-V2.5比meta的Muse Spark省了50% Token。

别小看这个数字。Agent任务绝非一问一答,往往涉及几百上千轮的工具调用、代码执行、错误诊断、自我修正。

Token消耗是指数级增长的,省42%意味着同样的预算,任务完成率大幅提升。

在Claweval的散点图上,MiMo-V2.5系列牢牢占据左上角最优区域,即通过率高且Token消耗低。

而DeepSeek V3.2位于右下角,通过率低且Token消耗极高。

技术路线已经出现分化。

省钱本身就是一种技术壁垒。

三、DeepSeek前核心成员罗福莉带队

罗福莉不是普通研究员。在DeepSeek期间,她是V2模型的核心研发成员。DeepSeek-V2去年以极致性价比震动行业,罗福莉是背后关键推手之一。

加盟小米后,她只花了36天就把MiMo从V2迭代到V2.5,性能从接近一线拉到对标顶尖。

更戏剧性的是,今年3月,MiMo-V2-Pro曾以"Hunter Alpha"的匿名身份上线OpenRouter平台,被大量开发者误认为是即将发布的DeepSeek V4。

一个小米的模型,被当成DeepSeek的下一代旗舰,这说明什么?说明在硬核开发者眼里,罗福莉出品,天然带有DeepSeek级别的技术预期。

当OpenAI靠Altman的品牌、DeepSeek靠梁文锋的极客文化吸引顶尖人才时,小米靠的是罗福莉这样的技术IP。

她不仅带来算法能力,更带来一套已经被验证过的高效训练+极致推理的方法论。

四、Mimo模型的竞争力人车家生态同步

OpenAI没有手机,DeepSeek没有汽车,Kimi没有IoT生态。小米有6亿+月活设备,有SU7,有澎湃OS,有从手环到电视的全场景入口。

现在谁家里没有一两件印着小米Logo的东西呢?

你的手机Agent自动整理相册并剪辑旅行视频;你的车机Agent根据实时路况和电量规划跨省路线;你的家庭Agent协调空调、灯光、扫地机器人完成"回家模式"。

这类任务超出了ChatGPT的能力边界,因为它们需要理解物理世界、调用硬件工具、在端侧高效运行。

小米自己做基座模型,目标绝非在榜单上打败OpenAI,核心诉求在于不让自己的生态命脉掌握在第三方手里。

当Agent成为下一代交互方式时,没有自研模型的大厂,才是真正的"组装厂"。

五、DeepSeek V4前夜发布

说到这儿,必须回到那个最敏感的话题:DeepSeek V4。

业内传闻,DeepSeek V4将于本周发布。而小米选择在这个时间点发布V2.5,很难说是巧合。

罗福莉从DeepSeek到小米,带走的东西远超某段代码本身,核心是对Scaling Law和Agent架构的深度理解。

当DeepSeek V4本周真的发布时,行业会再次为性能数字沸腾。

但不要忘了,就在它发布的前夜,一个硬件大厂已经证明:

AI竞争的下半场,核心看点已从谁更聪明,转向谁更能落地。

而落地,恰恰是小米最熟悉的主场。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version