国内大模型赛道迎来硬核技术突破。6月1日,稀宇科技正式发布了新一代大语言模型——MiniMax M3。该模型凭借前沿的编程实力、最高支持1M(100万)的超长上下文窗口以及原生多模态交互能力,成为国内首个同时集齐这三项顶尖技术指标的模型,同时也是目前全球范围内唯一具备此类性能的开源模型。
在衡量大模型核心竞争力的多项权威评测中,MiniMax M3交出了极为亮眼的成绩单。在极具挑战性的编程评测集 SWE-Bench Pro 上,M3取得了59.0%的优异得分,这一成绩不仅超越了 GPT-5.5和 Gemini3.1Pro,更逼近了行业标杆 Claude3.5Opus(此处对应原文Opus4.7趋向);而在考验 AI 智能体调度能力的 Claw-eval 评测,以及考察多模态文档解析能力的 OmniDocBench 测试中,M3均斩获了行业最高分或超越了 Gemini3.1Pro。
M3能够在性能飙升的同时保持高效运转,核心得益于其底层架构的重大创新。该模型采用了全新的稀疏注意力架构 MSA(MiniMax Sparse Attention)。在这种底层逻辑的加持下,模型在处理100万超长上下文时,每个 Token 的计算量竟然压缩至上一代模型的二分之一十。这直接带来了速度上的飞跃:在 Prefilling(预填充)阶段,模型运行加速超过9倍;而在 Decoding(解码生成)阶段,加速更是超过15倍,大幅降低了算力开支。
作为原生多模态模型,M3不仅能够深度理解文本,还支持图片、视频的主动输入,甚至能直接完成高难度的电脑桌面自动化操作。伴随模型的发布,MiniMax 同步升级了旗下的 AI 编程助手产品 MiniMax Code,并面向开发者推出了全新的 Token Plan 订阅方案,共分为 Plus(49元/月)、Max(119元/月)和 Ultra(469元/月)三档,以满足不同体量的开发需求。
目前,M3的 API 接口已正式对公众开放使用。为了吸引更多开发者卡位生态,官方还上线了限时福利,其512k上下文版本将开展为期7天的限时5折优惠。MiniMax 官方承诺,该模型的完整权重以及详细的技术报告将在10天内面向全球开发者正式开源。这种“底牌全露”的开源底气,无疑将进一步加速端侧与应用层 AI 创新的爆发。










