滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

英伟达与Mistral AI合作新突破：大模型性能跃升，小模型边缘部署灵活

时间：2025-12-03 23:28:24 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

法国人工智能初创公司Mistral AI与芯片巨头英伟达的合作取得重要进展，双方联合推出的新一代开源模型家族在性能、能效和部署灵活性方面实现显著突破。此次发布的模型系列包含一个大型前沿模型和九个小型高性能模型，覆盖从云端到边缘设备的全场景应用需求，标志着开源AI技术向实用化迈出关键一步。

核心突破体现在Mistral Large 3大型模型的性能跃升。该模型采用混合专家架构（MoE），总参数达675亿，活跃参数410亿，上下文窗口扩展至25.6万token。通过英伟达GB200 NVL72系统的优化支持，其处理速度较前代H200芯片提升10倍，每兆瓦能耗下可实现每秒超500万token的吞吐量。这种能效提升直接转化为单次响应成本下降30%，同时保持98.7%的精度指标，在医疗诊断、法律文书分析等复杂任务中表现突出。

技术实现层面，英伟达通过三项创新优化技术突破性能瓶颈。Wide Expert Parallelism技术重构了模型并行策略，使专家分配效率提升40%；NVFP4低精度推理框架在FP8精度下实现与FP16相当的准确率，内存占用减少50%；Dynamo分布式推理引擎则将长文本处理延迟降低65%。这些优化使Mistral Large 3在TensorRT-LLM等主流框架上的推理速度达到每秒12.8万token，较同类模型提升2.3倍。

针对边缘计算场景，Ministral 3系列推出九个轻量化模型，涵盖30亿、80亿和140亿参数规模，每个参数级提供基础版、指令优化版和推理加速版三种变体。所有模型均支持多模态输入，可处理12.8万至25.6万token的上下文，并在英伟达RTX 5090 GPU上实现每秒385token的推理速度。在Jetson Thor边缘计算平台上，8并发场景下吞吐量可达每秒273token，较上一代提升180%。

部署灵活性成为该模型家族的核心优势。大型模型可通过英伟达API目录直接调用，企业用户也可利用NIM微服务在自有GPU基础设施上部署；小型模型则支持在RTX PC、笔记本电脑及Jetson系列设备上离线运行，单卡即可驱动机器人、无人机等嵌入式系统。这种"云端-边缘"协同架构使某汽车制造商的自动驾驶系统响应延迟从120ms降至35ms，在隧道等弱网环境下仍能保持稳定运行。

商业化进程显著加速。Mistral AI本周与汇丰银行签署千万欧元级合作协议，为其提供金融分析、多语言翻译等定制化服务。在工业领域，该公司与新加坡内政科技局联合开发的安防机器人已进入实地测试阶段，其搭载的Ministral-14B-Instruct模型可在10瓦功耗下实现每秒52token的实时推理。汽车行业合作方面，与Stellantis集团共同研发的车载助手系统，通过微调80亿参数模型，在语音交互准确率上达到92.4%，较传统方案提升17个百分点。

资本市场的认可为技术突破提供支撑。这家成立仅两年的公司去年完成17亿欧元融资，估值突破117亿欧元，其中英伟达与ASML等战略投资者贡献主要份额。技术团队透露，下一代模型将引入动态稀疏激活技术，预计在2025年第三季度实现每瓦特性能再提升3倍，同时将上下文窗口扩展至百万token量级，进一步缩小与闭源模型的差距。

更多>同类资讯

长电科技与联电竞逐CPO赛道共筑下一代算力基石新蓝图

01-22

智驾生存法则：数据为王装车量定话语权，谁能笑傲2025？

01-22

长城“归元”平台赋能魏牌全新大型旗舰SUV谍照亮相科技配置拉满

01-22

2025企业微信AI机器人全攻略：3步配置+场景优化解锁客服提效降本新路径

企业微信2025年推出的智能机器人，结合企业微信服务商微盛·企微管家的AI工具，可增加多轮对话、情绪识别、业务系统对接等核心能力——多轮对话能处理“我要退货，已经寄回去了，什么时候退款？”用微盛·企微管家的企…

01-22

数字人IP“火火哥”“爆爆姐”登场，火爆品牌开启白酒年轻化新征程

未来，火爆将依托美加墨世界杯等国际顶级赛事平台，深度挖掘并释放 IP的多维价值，同时深耕传统文化基因，构建“IP+文化+焕新”的三位一体发展模式，通过持续更新内容、创新互动玩法、搭建用户共创机制，直击 Z…

01-22

吉利银河V900上市：以“平衡之道”解锁中国大家庭出行新体验

01-22

消息称苹果计划最早于今年春季推出AI家庭中枢设备配备 “机械旋转底座”

01-22

百川启动「海纳百川」计划，新推出的最低幻觉医疗大模型M3 Plus免费开放

01-22

制造业智能化浪潮下，华睿科技机器视觉与AMR双赛道如何突围？

01-22

IPO新征程：科大智能凭数字能源与智能机器人双轮驱动能否突围？

01-22

AI创新驱动存储器需求激增产业产值预计2027年跃升至8427亿美元

01-22

复旦团队全球首创“纤维芯片”：柔软可编织，为新兴产业带来新可能

01-22

AI时代教育新变革：以提问为钥启孩子无限未来之门

01-22

复旦团队突破芯片柔性难题新“纤维芯片”可弯折拉伸

01-22

CV4CHL Workshop征稿开启聚焦AI与计算机视觉助力儿童健康成长

01-22

点击查看更多 +

全站最新

全新宝马iX3长轴距版4月亮相北京车展科技配置升级续航实力强劲

吉利银河V900上市：以“平衡之道”解锁中国大家庭出行新体验

新世代BMW iX3长轴距版北京车展首发：驾控升级，智能化电动化体验迈向新高度

宾利全新纯电SUV谍照来袭：独特外观内饰，续航性能实力不凡

极寒冬测锤炼品质：智己新车以严苛考验，兑现对用户的安心承诺

新世代BMW iX3长轴距版北京车展首发续航超900km还搭中国专属智驾系统

热门内容

本栏最新

长城“归元”平台赋能魏牌全新大型旗舰SUV谍照亮相科技配置拉满

2025企业微信AI机器人全攻略：3步配置+场景优化解锁客服提效降本新路径

数字人IP“火火哥”“爆爆姐”登场，火爆品牌开启白酒年轻化新征程

吉利银河V900上市：以“平衡之道”解锁中国大家庭出行新体验

长安汽车携手美的集团深化合作，共创“人车家”智慧生活新篇章

2025年销近5万！宇通客车以创新产品与服务书写全球领跑新篇章

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.