ITBear旗下自媒体矩阵:

稀宇科技发布MiniMax M3大模型:编程超GPT-5.5,超长上下文与多模态能力全球唯一开源

   时间:2026-06-01 19:44:20 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国内人工智能领域迎来重要进展,稀宇科技推出的新一代大语言模型MiniMax M3正式亮相。该模型凭借三项突破性技术指标引发行业关注:原生多模态交互能力、百万级超长上下文窗口支持,以及领先的编程处理性能。作为全球首个同时具备这些特性的开源模型,其技术架构创新与商业应用布局均展现出独特优势。

在权威评测体系中,MiniMax M3展现出强劲实力。编程能力测试集SWE-Bench Pro数据显示,该模型以59.0%的准确率超越GPT-5.5和Gemini3.1Pro,与行业标杆Claude3.5Opus的差距缩小至微小范围。在智能体调度评测Claw-eval和多模态文档解析测试OmniDocBench中,M3同样取得领先成绩,部分指标甚至实现对主流商业模型的全面超越。这些数据印证了其在复杂任务处理领域的突破性进展。

技术架构层面,模型采用的MiniMax Sparse Attention(MSA)稀疏注意力机制成为关键突破。通过优化注意力计算模式,处理百万级上下文时单个Token的计算量较前代降低50%。这种设计带来显著效率提升:预填充阶段处理速度提升9倍以上,解码生成阶段更是达到15倍加速。算力成本的优化使得大规模模型部署更具可行性,为商业化应用扫清重要障碍。

多模态交互能力方面,M3突破传统文本处理框架,实现跨媒介信息理解。除基础文本处理外,模型可直接解析图像、视频输入,并具备桌面自动化操作能力。这种原生多模态设计使AI应用场景大幅扩展,从代码生成到复杂系统控制均展现出技术潜力。配套升级的AI编程助手MiniMax Code,通过Token Plan订阅制提供差异化服务,三个价位套餐满足个人开发者到企业团队的不同需求。

开发者生态建设同步推进,M3的API接口已全面开放。为降低接入门槛,官方推出限时优惠活动:512k上下文版本前7天使用费用减半。更值得关注的是,模型完整权重与技术文档将在10日内全球开源,这种开放策略既彰显技术自信,也为全球AI社区注入创新活力。行业观察人士指出,这种"全透明"的开源模式可能重塑大模型领域的竞争格局,加速端侧AI应用的爆发式增长。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version