上海AI领域迎来新突破,一家名为MiniMax的独角兽公司近期震撼发布了其自主研发的全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型的问世,迅速在权威评测榜单上占据一席之地,仅次于最新发布的DeepSeek-R1-0528,成为全球开源模型的佼佼者。MiniMax的创始人兼CEO闫俊杰在社交媒体上难掩激动之情,表示这一成就让他深切感受到,看似不可逾越的高峰实则能够被征服。
MiniMax-M1不仅在业界引起了广泛关注,其技术细节更是令人赞叹不已。该模型在长文本处理和工具调用能力上展现出卓越的性能,支持处理高达100万token的上下文输入,这一能力足以一次性涵盖整部《三体》英文原著的内容。与DeepSeek同类模型相比,MiniMax-M1的性能提升了八倍,甚至与谷歌最新的闭源模型Gemini2.5Pro不相上下。
尤为MiniMax在强化学习阶段的研发投入极具效率,仅为53.5万美元,远低于行业内普遍高达千万级别的研发成本。这一显著的成本控制不仅彰显了MiniMax的研发实力,也凸显了其在产品化方面的卓越能力。在M1模型发布后的极短时间内,MiniMax连续推出了多款创新产品,包括视频生成模型Hailuo02、通用智能体MiniMax Agent、视频创作智能体Hailuo Video Agent以及音色设计工具Voice Design,保持了惊人的产品更新速度。
作为总部位于上海徐汇区的AI企业,MiniMax早在ChatGPT引发全球热潮之前,便前瞻性地布局了通用人工智能(AGI)领域。公司果断摒弃了当时盛行的大模型稠密架构和传统注意力机制,这一战略决策在全球大模型研发企业普遍收缩的背景下显得尤为坚定。MiniMax始终坚守基础模型研发的战略方向,最终迎来了这一具有里程碑意义的技术突破。
MiniMax-M1的发布不仅标志着MiniMax在技术上取得了重大进展,更为整个AI行业注入了新的活力。这一创新成果或将引领开源AI模型的发展方向,为行业的未来发展开辟了新的道路。