春节档向来是科技企业竞相角逐的黄金时段,今年国产人工智能大模型领域掀起新一轮“上新潮”,多家企业密集推出新品,引发行业高度关注。上海企业MiniMax率先发力,其新一代文本模型MiniMax M2.5于2月12日正式上线,次日即面向全球开源并支持本地化部署。这款被业界称为“王炸”的模型,在性能上与美国Anthropic公司开发的Claude Opus 4.6不相上下,但价格仅为后者的二十分之一,迅速引发全球开发者热议。
M2.5的突破性体现在多个维度。在编程能力方面,该模型在SWE-Bench Verified榜单上取得80.2%的高分,与Claude Opus 4.6差距微乎其微;在多语言任务测试中,更以绝对优势超越对手登顶榜首。办公场景应用同样出色,其生成的财务报表格式规范、数据分层清晰,在金融建模等复杂任务中展现出专业水准。更令人瞩目的是,这款性能强劲的模型参数量仅100亿,堪称全球同类旗舰模型中的“轻量级冠军”。
价格与效率的双重优势成为M2.5的核心竞争力。该模型推理速度达每秒100次事务处理,较主流模型提升近一倍;输入成本约0.3美元/百万Token,输出成本2.4美元/百万Token。按每秒输出100Token计算,1美元即可支持智能体连续工作一小时,这种“白菜价”策略被开发者称为“颠覆性创新”。OpenClaw项目创始人彼得·斯坦伯格评价称,M2.5在保持高性能的同时,成功解决了大模型“昂贵”与“迟缓”的行业痛点。
竞争格局因另一款国产模型的加入而更加激烈。2月11日登陆港交所的智谱AI,紧随其后发布GLM-5模型。这款被定位为“系统架构师”的新品,在编程与智能体协作能力上表现突出。开发者实测显示,GLM-5在真实编程场景中的体验已接近Claude顶级模型水平。在全球权威评测榜单Artificial Analysis中,GLM-5位列全球第四、开源模型第一。该模型特别强化了多智能体协作能力,可像人类工程师般分配任务、构建系统,在代理编程测试中略胜Claude一筹。
图像生成领域同样迎来重要突破。2月10日,千问团队推出Qwen-Image 2.0模型,支持超长指令输入(达1000词元),显著提升推理能力。其开发团队透露,新模型成功解决AI生成图像中的“汉字乱码”难题,通过增强指令理解能力,使图片中的文字呈现更加准确。几乎同时,字节跳动发布Seedream 5.0模型,在文生图质量上实现跨越式提升。这两款模型的推出,标志着国产多模态大模型进入新的发展阶段。
基础大语言模型领域也不乏亮点。DeepSeek近期低调上线新款模型,虽未涉及多模态功能,但将上下文处理能力提升至100万词元,相当于可一次性理解整套《三体》小说(约90万字)。开发者指出,目前支持百万级词元处理的模型屈指可数,DeepSeek此次升级使其跻身谷歌Gemini、Anthropic Claude等国际顶尖模型行列。
据行业观察,这波“上新潮”远未结束。豆包2.0、千问3.5等旗舰模型将于近期陆续发布,国产大模型正通过持续创新重塑全球竞争格局。从文本生成到多模态交互,从基础能力到场景应用,中国AI企业正以集群式突破,在春节档这个特殊时间节点向世界展示技术实力。这场没有硝烟的竞争,不仅关乎企业市场份额,更决定着未来人工智能生态的主导权归属。








