国内人工智能领域近日诞生一项里程碑式成果——稀宇科技正式推出新一代开源大模型MiniMax M3。这款模型以三项突破性能力引发行业关注:不仅支持百万级超长上下文处理,更首次在国内实现图片、视频输入与电脑桌面操作的原生多模态交互,成为首个集齐这三项核心技术的开源模型。其编程能力在权威评测中表现尤为亮眼,在SWE-Bench Pro编程基准测试中以59.0%的得分超越GPT-5.5与Gemini 3.1 Pro,与行业顶尖的Opus 4.7仅存在微小差距。
在多维度能力验证中,MiniMax M3展现出全面领先的技术实力。除编程测试外,该模型在Claw-eval智能体能力评估与OmniDocBench多模态文档理解测试中均斩获最高分,其处理复杂任务时的逻辑推理与跨模态理解能力获得专家高度评价。特别值得关注的是,模型在支持百万字上下文时仍保持高效运行,这一特性为法律、科研等需要处理长文本的领域开辟了新的应用空间。
技术架构创新是性能跃升的关键支撑。研发团队采用的稀疏注意力架构(MSA)通过优化计算路径,将百万字场景下的单token计算量缩减至前代模型的50%。这种设计使模型在理解阶段提速超9倍,答案生成效率提升15倍以上。更令开发者振奋的是,稀宇科技同步开放模型API使用权限,并承诺10日内向全球社区公开模型权重与完整技术文档,此举有望加速多模态技术在工业界的落地进程。
行业观察人士指出,MiniMax M3的开源策略可能重塑国内AI生态格局。其多模态交互能力与超长上下文处理的结合,为智能办公、数字内容创作等领域提供了全新解决方案。目前已有金融、医疗等行业机构启动与研发团队的对接,探索模型在专业场景中的定制化应用。随着技术文档的全面公开,预计将引发新一轮基于该架构的二次开发热潮。












