人工智能领域迎来新突破,专注于智能体效率提升的轻量级大模型MiniMax-M2正式发布并开源。这款由MoE架构构建的模型总参数规模达2300亿,其中活跃参数仅100亿,在保持低计算成本的同时,实现了编程能力与通用智能的双重突破。
在权威基准测试中,该模型展现出超越Gemini 2.5 Pro和DeepSeek-V3.2等头部模型的实力,性能指标直逼尚未正式发布的GPT-5(thinking)版本。特别在端到端工具调用场景下,其部署便捷性和扩展能力获得测试机构认可,成为当前最易落地的先进智能体模型之一。
核心优势体现在四个维度:通用智能层面,在Artificial Analysis的全球开源模型评测中,数学、科学、指令遵循等维度的综合得分位居榜首;编程能力方面,专门优化的多文件协同编辑机制,使代码生成-运行-调试循环效率提升37%;智能体执行层面,可自主规划跨浏览器、终端、代码库的复杂操作链,在漏洞追踪测试中保持92%的证据完整率;架构设计上,100亿激活参数实现毫秒级响应,吞吐量较同类模型提升2.3倍。
实测数据显示,在Multi-SWE-Bench跨语言编程测试中,该模型以81.3%的任务完成率领先Claude Sonnet 4达14个百分点;Terminal-Bench终端操作测试得分较DeepSeek-V3.2提高19%;在需要跨平台协作的BrowseComp评估中,其操作稳定性指标达到顶尖模型的1.8倍。特别在物理模拟场景中,模型能自动生成可交互的参数控制面板,虽在复杂力学场景下存在5%的偏差率,但调试效率较前代提升40%。
开发者可通过MiniMax Agent平台限时免费体验,输入"创建旋转六边形弹球系统"等指令,3分钟内即可生成包含轨迹可视化、参数调节的完整应用。平台自动完成的测试用例覆盖基础功能验证、异常处理、UI适配等12个环节,较传统开发流程节省65%的调试时间。当指令升级为"双球质量差异模拟"时,系统虽出现边界溢出,但自动生成的调试日志详细记录了7次参数优化过程。
技术开放层面,模型权重已在Hugging Face平台开源,支持本地化部署。开发者可通过MiniMax开放平台调用API,当前提供每日50万tokens的免费额度。平台文档显示,其代码生成接口支持Python、Java等23种编程语言,智能体调度接口可集成Chrome、VS Code等18类开发工具。
实测生成的物理模拟应用已开放两个演示版本,用户可调整六边形转速、小球材质等14个参数。在质量差异测试中,系统虽未完全实现预期轨迹,但自动生成的3D可视化模块能精准显示动量守恒数据,为开发者提供了有价值的调试参考。这种"生成-验证-优化"的闭环能力,标志着智能体模型向自主开发工具的实质性迈进。











