ITBear旗下自媒体矩阵:

法国Mistral 3系列大模型发布 对比评测聚焦中国开源模型

   时间:2025-12-03 20:43:41 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

法国人工智能公司Mistral近日正式发布Mistral 3系列大模型,这家被视为"欧洲AI希望"的企业以全系列Apache 2.0开源协议开放模型权限,其旗舰模型Mistral Large 3采用混合专家架构(MoE),总参数量达6750亿,激活参数410亿。该模型在LMArena开源非推理模型榜单中位列第二,综合排名第六,训练过程动用了3000张NVIDIA H200显卡。

与前代产品显著不同的是,本次官方基准测试直接对标中国开源模型DeepSeek-V3.1和Kimi-K2。第三方人类评估数据显示,Mistral Large 3在通用任务中分别以53%和55%的胜率领先对手,多语言场景下优势进一步扩大至57%和60%。这种对比策略的转变,折射出全球开源AI生态格局的微妙变化——Mistral 2发布时其对比对象还集中在GPT、Claude等海外闭源模型。

在轻量化模型领域,Ministral 3系列推出30亿、80亿和140亿参数的密集型模型,每个尺寸均提供预训练、指令微调和推理强化三个版本。官方宣称14B推理版在AIME 2025数学竞赛基准测试中取得85%的准确率,8B指令版生成的文本token数量较同类模型减少一个数量级。所有小尺寸模型均支持40余种语言和图像理解功能,展现出较强的多模态处理能力。

硬件适配方面,Mistral与NVIDIA、vLLM、Red Hat建立深度合作。旗舰模型可部署于Blackwell NVL72超级计算系统,也能在单个配备8块A100或H100的节点运行;轻量级模型则覆盖从DGX Spark工作站到RTX消费级显卡,甚至支持Jetson边缘计算设备。API服务已登陆主流云平台,并提供定制化训练方案。

值得关注的是,这家估值达140亿美元的欧洲AI独角兽,在模型对比策略上的转向颇具象征意义。当Mistral 3的评测数据不再将海外闭源模型作为主要参照系,而是选择中国开源方案作为对标对象时,某种程度印证了中国AI技术在特定领域已形成全球影响力。不过业内人士提醒,在复杂推理、长文本处理等维度,开源模型与头部闭源产品仍存在明显差距。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version