ITBear旗下自媒体矩阵:

稀宇科技MiniMax M3模型正式开源!多模态能力出众且输出速度持续提升

   时间:2026-06-16 06:01:34 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

稀宇科技旗下MiniMax团队近日宣布,其自主研发的多模态大模型MiniMax M3已正式开源。该模型总参数规模达4280亿,其中激活参数230亿,是全球首个从训练初始阶段即采用多模态混合架构的开源项目。此次开源不仅包含模型权重,还同步公开了MSA(MiniMax Sparse Attention)稀疏注意力机制的技术论文。

据技术团队披露,M3模型在Artificial Analysis综合智能评测中创下开源领域新高,上线两周即登顶全球开源模型排行榜。该模型突破传统单模态训练范式,通过原生多模态架构实现文本、图像、音频等数据的联合训练,在编码能力与智能体任务处理方面达到行业领先水平。

针对初期访问量激增导致的服务压力,开发团队已完成首轮优化:模型输出速度从初始的30次/秒提升至80次/秒,后续计划再提速30%-40%。性能提升主要得益于架构优化与分布式计算效率改进,用户将获得更流畅的交互体验。

在专业能力验证方面,M3展现出显著优势。其代码生成模块支持自主任务拆解、工具链调用及多步逻辑推理,生成的代码可直接交付使用,避免传统模型"能运行但需人工修改"的局限。智能体评测数据显示,该模型在复杂任务处理中的准确率较同类产品提升27%。

目前,MiniMax M3的完整代码库与预训练权重已通过开源社区发布,开发者可自由获取模型文件及技术文档。此次开源标志着多模态大模型技术进入新的发展阶段,为AI应用开发提供了更高效的底层支持。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version