ITBear旗下自媒体矩阵:

MiniMax M2:多模态深耕与全面优化,为智能应用普及带来新可能

   时间:2025-10-28 11:18:24 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近期,基础模型市场再次热闹起来,各厂商纷纷推出新动作。不过,仔细分析可以发现,这些厂商的策略大致分为两类。一类厂商选择在模型的某个难点上集中突破,力求成为该领域的顶尖水平,以此在开发者群体中树立鲜明形象,但这种做法可能限制其作为基础模型供应商的广泛适用性。另一类厂商则追求全面发展,在多个模态上齐头并进,逐步构建起一个全面的基础模型体系。

在全面发展的厂商中,MiniMax凭借其全球领先的语音和视频模型脱颖而出。近日,该公司又推出了其基础模型体系的最新成员——MiniMax M2,进一步巩固了其在多模态模型领域的领先地位。

10月28日,MiniMax正式对外发布了MiniMax M2。这款模型专为编程和智能体应用设计,同时保持了轻量级和高灵敏度的特点。在通用能力的基础上,MiniMax M2进行了针对性优化,其上下文窗口达到了当前主流模型的平均水平,最大输入和输出token总和为200k,最大输出token为128k。该模型还提供了端到端的工具使用性能,满足了开发者的实际需求。

MiniMax M2被定义为“极具成本效益的模型”,以其全球领先的性价比和极致速度为卖点。该模型拥有2300亿总参数,但激活参数被控制在100亿以内,有效降低了计算成本。在Artificial Analysis这一权威评测榜单上,MiniMax M2在数学、科学和编码等多个核心领域表现出色,总分位列全球前五。这表明,MiniMax M2在提升编程和智能体能力的同时,并未牺牲其综合性能。

更令人瞩目的是,MiniMax M2在保持高性能的同时,还大幅降低了使用成本。据MiniMax介绍,该模型在某些任务上的成本仅为Claud的8%。目前,MiniMax M2的API价格定为每百万Token输入0.3美金(约合2.1元人民币),输出1.2美金(约合8.4元人民币)。同时,该模型还提供了每秒输出约100个Token的推理服务,且速度仍在不断提升。从价格和速度的综合性能来看,MiniMax M2已成为市场上最具性价比的模型之一。

为了吸引更多开发者体验,MiniMax在发布后宣布延长免费测试时间,用户可在11月6日前免费使用该模型。MiniMax在官方公告中表示:“我们目前在免费提供MiniMax Agent,直到服务器无法承受为止。”这一策略取得了显著效果,限时免费期间,开发者的调用量快速增长,MiniMax M2已成为OpenRouter上调用量排名第十的模型。

MiniMax M2的成本控制得益于模型技术的更新和工程能力的提升。在发布MiniMax M2的同时,MiniMax还宣布其Agent应用同步更新,并推出了安卓和iOS版本。这一策略与OpenAI发布Sora2时类似,即模型从第一天起就以产品的形式呈现,因为模型和工程能力已经密不可分。用户在使用以Agent能力为核心的产品时,能够直接感受到模型能力的进步,这些技术变化不再仅仅停留在论文和技术报告中,而是成为了用户可感知的产品能力。

为了验证MiniMax M2的实际表现,我们进行了几组测试,包括写文章的速度、编程能力以及能否完成整个开发闭环。在写文章测试中,我们要求MiniMax M2和Claude 4.1用同样的题目《AI智能体的未来》写一篇约800字的中文文章。结果显示,MiniMax M2几乎瞬间完成了文章,而Claude 4.1还在逐段生成。从内容结构和语言上看,MiniMax M2的表现也相当正常,给人一种“响应即结果”的流畅体验。

在编程能力测试中,我们选择了经典的Gilded Rose Refactoring Kata项目。该项目要求模型在不影响原有功能的情况下,优化代码结构并添加新功能。MiniMax M2在加载项目后,自动判断了语言版本并选择了Python实现。它首先解析了原始代码中的商品类型和逻辑关系,然后提出了采用策略模式重构的方案。在重构过程中,MiniMax M2同步修改了测试脚本和示例文件,确保数据初始化和边界条件与新架构一致。经过几轮调试后,所有测试均通过,展示了MiniMax M2在编程能力上的出色表现。

我们还测试了MiniMax M2的端到端开发能力。我们给它两个空文件:一个calc.py和一个测试文件test_calc.py,要求实现加法和除法功能,并处理除以零的错误。MiniMax M2先读取测试文件,然后编写代码。在第一次运行pytest报错后,它立即分析了错误原因并进行了修复。整个过程不到一分钟,从空白文件到测试全绿,展示了MiniMax M2在独立开发方面的能力。

在网页交互任务测试中,我们采用了“受控指令”的方式来评估MiniMax M2的three.js编程能力。我们明确规定了每一项功能,包括创建太阳与三颗行星的三维场景、实现自转与公转动画、显示轨道辅助线等。评测结果显示,MiniMax M2在第一次编程时完成了大部分功能,仅在“统一控制行星大小”方面需要新增一次对话进行修改。从运行日志来看,MiniMax M2的工作过程呈现出清晰的“生成—验证—修复”节奏,展示了其在代码生成和调试优化方面的能力。

随着Agent技术的兴起,关于“模型即agent”还是应用本身需要更多工作的讨论日益激烈。MiniMax M2的出现为这些讨论提供了新的视角:在各模态模型上都达到顶尖水平的公司,可能更能够将Agent能力更好地提供给所有人。目前,MiniMax的语音模型和视频模型均处于全球领先水平。这些模型的优异表现并非单纯的“雕花”创新,而是源于MiniMax在技术架构上的创新,如Speech模型的Flow-VAE架构和Hailuo 02视频模型的NCR架构。

MiniMax在技术追求上显得与众不同。它宁愿花费更多时间,甚至显得“笨拙”一些,也要为技术的底层进步做出贡献,解决技术落地过程中的实际问题。在文本模型领域,MiniMax也走过了相似的道路。从年初发布和开源的MiniMax 01系列开始,到后来的M1、今天的M2,模型在不断进化中。最终,MiniMax交出了它心目中这个阶段最能解决实际问题的Agent模型。它既是模型也是应用,是MiniMax“让每个人都拥有充裕的智能”过程中的重要一步。

目前,用户可以通过MiniMax Agent APP、API和各大模型平台使用MiniMax M2。而且,MiniMax宣布Agent和模型全球限时免费14天,用户可以尽情体验。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version