春节前夕,国产AI大模型领域迎来新一轮激烈竞争,DeepSeek、智谱、字节跳动等企业纷纷推出模型更新。其中,MiniMax-M2.5的正式上线引发行业关注,该模型在Agent智能体与编程能力方面实现显著突破。
据MiniMax AI工程团队在海外社交平台披露,研发过程中随着训练计算资源的持续投入,模型性能呈现阶梯式提升。团队负责人幽默表示,既期待产品尽快发布以便回家过年,又为效果优化带来的延迟感到纠结。目前用户已可在平台选择使用M2.5版本。
在实测环节,该模型展现出突出的网页开发能力。当要求制作苹果公司投资分析仪表盘时,系统不仅完整呈现财务健康度、技术面分析等核心指标,还通过动态图表实现数据可视化交互。用户鼠标悬停即可查看具体数值,SWOT分析模块的详细程度超出预期。更令人惊喜的是,输入简单指令即可生成可运行的"黄金矿工"网页游戏,包含完整的关卡设计和音效系统。
专业文档生成方面,模型展现出强大的结构化处理能力。在梳理AI开源推理生态的测试中,其输出的6000字报告采用表格对比不同框架特性,内容详实度获得认可。针对AI 3D建模工具开发需求,系统自动生成包含用户画像、功能需求、运营路径的多维度文档,关键信息覆盖率达90%以上。
PPT制作测试出现有趣现象,为提升内容吸引力,模型创造性地运用比喻修辞手法。在讲解唐代历史时,将长安城比作现代一线城市,用"朋友圈"概念解释文人社交,这种年轻化表达方式显著增强了内容亲和力。不过在版式设计精细度方面仍有改进空间,部分图表存在对齐偏差问题。
定时任务执行暴露出信息时效性短板。在科技新闻摘要任务中,系统抓取的8条资讯均来自2025年旧闻,未能满足24小时内新鲜资讯的要求。虽然内容总结准确,但已丧失新闻核心价值。TikTok趋势分析任务表现相对较好,不仅识别出热门挑战和音频标签,还能根据平台特性给出内容创作建议。
视频生成测试显示,模型对复杂场景的理解能力有待加强。当要求制作特定犬种的运动视频时,虽然画面氛围和背景元素还原准确,但主角犬种出现偏差。不过在物体运动轨迹和光影效果处理上,已达到行业中等水平。
资本市场对技术突破反应迅速,MiniMax股价在消息公布后单日涨幅达14.62%,盘中最高冲至23.5%,公司总市值突破1600亿元人民币。根据港交所披露,企业将于3月初发布年度财务报告,届时可能公布更多技术商业化进展。
从行业视角观察,Agent能力与编程开发已成为大模型竞争的核心赛道。虽然MiniMax-M2.5在多个场景展现实用价值,但测试结果显示其输出结果仍需人工校对,需求理解准确率存在波动。这种"可用但需优化"的状态,恰是当前AI技术发展的普遍特征。





