近期,上海AI领域的佼佼者MiniMax(稀宇科技)举办了一场盛大的“技术盛宴”,在一周内连续推出了五款重量级产品,覆盖基座模型、多模态技术以及智能体等多个维度,展现了其在AI技术研发上的深厚积累和创新能力。
在AI领域竞争日益激烈的背景下,MiniMax推出的全球首个开源大规模混合架构推理模型MiniMax-M1尤为引人注目。该模型凭借其独特的“闪电注意力”混合架构和创新的CISPO算法,在多个生产力场景中展现出了卓越的性能,甚至能与顶尖闭源模型一较高下。在最新的Artificial Analysis Intelligence Index榜单中,MiniMax-M1荣登全球开源模型第二名,受到了海内外的广泛关注。
MiniMax在多模态领域也取得了重大突破。其新一代视频生成模型Hailuo-02以“世界一流的效果”和“颠覆性的成本效益”挑战国际顶尖模型。该模型的核心在于创新的Noise-aware Compute Redistribution(NCR)架构,使得模型参数和训练数据量大幅提升的同时,效率也实现了显著提升。Hailuo-02制作的“猫猫跳水”视频在短时间内就吸引了全球上亿人的围观,充分展示了其强大的视频生成能力。
MiniMax在智能体产品方面也取得了显著成果。其通用智能体产品MiniMax Agent能够完成长程复杂任务,具备多步规划专家级解决方案的能力,并且能够灵活拆解任务需求并执行多个子任务。这一产品体现了MiniMax对“AI能力”的深刻理解和应用。
MiniMax还推出了国内首个成片创作助手Hailuo Video Agent。该产品能够自动分析、构思并生成专业级完整视频内容,大大降低了视频创作的门槛。通过LLM语言模型、全流程工具集以及Agent思维链等技术创新,Hailuo Video Agent为用户提供了自定义编辑的可视窗口与操作空间,使得视频创作变得更加便捷和高效。
在语音模型方面,MiniMax也进行了功能更新。Voice Design功能允许用户通过自然语言描述心中所想音色,实现多维度精准控制,甚至生成世界上不存在的音色。与Speech 02配合,用户可以在文字转语音中实现“任意语言×任意口音×任意音色”的全自定义无限组合。这一功能更新解决了语音合成行业精准匹配细分场景需求和无风险实现自定义音色表达的挑战。
MiniMax的这一系列技术成果不仅彰显了其强大的研发实力,也为全球AI行业的发展提供了新的思路。面对外部算力限制和技术封锁,MiniMax坚定走“自主创新”道路,从底层基础模型优化到架构和算法迭代,形成了良性循环。其开源策略更是彰显了中国新一代AI企业的技术自信和开放胸怀。
作为徐汇区人工智能的龙头企业,MiniMax与商汤科技、阶跃星辰等企业共同形成了“北斗七星”矩阵,标志着徐汇区已经形成了“技术研发—场景落地—产业协同”的闭环生态。这一生态的形成将为徐汇区乃至全球的AI行业发展注入新的活力。