ITBear旗下自媒体矩阵:

小米开源MiMo-V2.5系列模型:技术领先,首日适配七大芯片厂商并推百万亿Token激励

   时间:2026-04-28 16:53:50 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

小米近日宣布开源其最新研发的MiMo-V2.5系列大模型,采用MIT协议,允许商业推理部署和二次训练,无需额外授权。这一系列模型包括MiMo-V2.5-Pro和MiMo-V2.5两款,具备更强的智能体能力,支持100万上下文,并在Token使用效率上实现显著提升。

MiMo-V2.5-Pro作为该系列中最强大的模型,拥有1.02万亿个参数,其中420亿个为激活参数。该模型基于混合注意力架构,在通用智能能力、复杂软件工程和长时域任务处理方面均有显著进步。其预训练使用了27万亿个Token,采用FP8混合精度,原生序列长度为32K,上下文扩展至100万个Token。后训练过程分为三阶段,包括监督式微调、领域专精训练和多教师策略蒸馏,确保模型在数学、安全、智能工具使用等领域具备卓越表现。

MiMo-V2.5则是一款3100亿参数的稀疏混合专家模型,拥有150亿激活参数,在48万亿个Token上进行训练。该模型继承了MiMo-V2-Flash的混合滑动窗口注意力机制,并搭载自研的预训练视觉和音频编码器,通过轻量化投影模块实现跨模态融合。其训练过程分为五个阶段,逐步提升上下文窗口容量,最终达到100万Token,并通过强化学习和多目标偏好蒸馏强化模型的感知和逻辑推理能力。

根据最新公布的基准测试结果,MiMo-V2.5-Pro在GDPVal-AA、Claw-eval等多项测评中超越了DeepSeek最新发布的DeepSeek-V4-Pro模型,以及Kimi K2.6等主流闭源模型,成为总体表现最佳的开源模型。MiMo-V2.5也在多项测评中大幅超越DeepSeek-V4-Flash,展现出强大的竞争力。

在开源首日,MiMo-V2.5-Pro已完成与阿里平头哥、亚马逊云科技、AMD、百度昆仑芯、燧原科技、沐曦和天数智芯等多家芯片厂商的接入适配。同时,该系列模型也完成了与SGLang和vLLM主流推理框架的Day 0适配,确保模型在不同硬件和软件环境下的高效运行。

为推动AI应用的普及,小米同步推出了“百万亿Token创造者激励计划”和“Agent生态共建计划”。前者将在30天内免费发放总计100万亿Token权益,面向全球AI用户开放申请,最高可获得价值659元的16亿Credits。后者则面向全球Agent框架团队提供专项支持,包括MiMo Token限免和参与AI Hackathon等共创活动。目前,小米已与OpenCode、Hermes Agent、KiloCode等Agent框架厂商展开深度合作。

随着大模型行业开源力度的持续加大,模型与芯片的适配已成为刚需,推理效率和部署成本成为下一阶段竞争的核心。小米MiMo-V2.5系列的发布,不仅在技术上实现了突破,更通过开放的生态合作和激励计划,推动了AI技术的广泛应用和落地。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version