ITBear旗下自媒体矩阵:

MiniMax-M1震撼登场!全球首开混合架构推理模型新纪元

   时间:2025-06-17 09:13:40 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

MiniMax公司近期震撼发布其划时代的新模型——MiniMax-M1,这款模型以其开源特性及大规模混合架构,在复杂生产力场景中大放异彩,树立了开源模型的新标杆。MiniMax-M1不仅在国内超越了众多闭源模型,其性能更是逼近国际顶尖水平,同时保持了业界无与伦比的性价比优势。

尤为引人注目的是,MiniMax-M1能够处理高达100万的上下文输入,这一能力与海外顶级闭源模型Google Gemini2.5Pro比肩,相较于DeepSeek R1,更是实现了8倍的提升。该模型还能输出长达8万Token的推理结果,这得益于MiniMax独创的混合架构,特别是其核心的闪电注意力机制,使得在处理超长上下文和深度推理任务时,效率实现了质的飞跃。例如,在深度推理8万Token的任务中,MiniMax-M1的算力需求仅为DeepSeek R1的30%,展现了显著的算力效率。

在强化学习领域,MiniMax同样取得了突破,提出了全新的CISPO算法。该算法通过优化重要性采样权重,极大地提升了强化学习的训练效率。在AIME实验中,CISPO算法的收敛速度较其他算法,包括字节最新提出的DAPO,快了一倍,甚至超越了DeepSeek早期采用的GRPO算法。这些技术创新使得MiniMax-M1的强化训练过程异常高效,训练成本大幅降低,仅用了512块H800三周的时间,租赁成本远低于预期。

在评测表现上,MiniMax-M1同样不负众望,在业内主流的17个评测集中均取得了优异成绩。特别是在软件工程、长上下文理解与工具使用等复杂生产力场景中,MiniMax-M1展现出了压倒性的优势。在SWE-bench基准测试中,MiniMax-M1-40k和MiniMax-M1-80k分别取得了55.6%和56.0%的高分,虽然略低于DeepSeek-R1-0528的57.6%,但远超其他开源模型。凭借百万级的上下文窗口,MiniMax-M1在长上下文理解任务中更是独领风骚,不仅超越了所有开源模型,还在某些方面逼近了OpenAI o3和Claude4Opus,位列全球第二。

在代理工具使用场景(TAU-bench)中,MiniMax-M1同样表现出色,不仅领跑所有开源模型,还成功击败了Gemini-2.5Pro。MiniMax-M1-80k在多数基准测试中的表现均优于MiniMax-M1-40k,这充分证明了增加计算资源对于提升模型性能的有效性。

价格方面,MiniMax-M1继续保持亲民路线,成为业内价格最低的模型之一。用户可以在MiniMax APP和Web上不限量免费使用该模型,同时,官网也提供了极具竞争力的API服务价格。这一举措无疑将进一步推动MiniMax-M1的市场普及和应用拓展。

感兴趣的用户可以通过以下链接获取MiniMax-M1的模型资源:MiniMax-M1-40k位于huggingface.co/MiniMaxAI/MiniMax-M1-40k,而MiniMax-M1-80k则位于huggingface.co/MiniMaxAI/MiniMax-M1-80k。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version