滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

Meta发布MobileLLM-R1：不足1B参数小模型，以低量训练达高效能

时间：2025-09-15 16:04:45 来源：机器之心Pro编辑：快讯 IP：北京 发表评论无障碍通道

meta AI团队近日正式推出MobileLLM-R1系列高效推理模型，标志着小参数语言模型进入全新发展阶段。该系列包含140M、360M和950M三种参数规模的基础模型及对应最终版本，专为数学计算、编程（Python/C++）和科学问题解决而设计，属于监督微调（SFT）模型而非通用聊天模型。

研发团队通过创新训练方案显著提升模型效率，950M参数版本仅使用约2T高质量token进行预训练，总训练量不足5T，却在MATH、GSM8K、MMLU和LiveCodeBench等基准测试中展现出惊人性能。与使用36T token训练的Qwen3 0.6B模型相比，该模型在各项指标上均达到同等水平甚至更优表现。在MATH基准测试中，950M模型的准确率是Olmo 1.24B模型的五倍，较SmolLM2 1.7B模型提升两倍，编码测试成绩更是在开源模型中创下新高。

该系列模型的突破性进展引发机器学习领域广泛关注。行业分析师指出，训练成本的指数级下降与性能的指数级提升形成鲜明对比，这种"降本增效"模式正在重塑模型开发范式。通过优化token使用效率，研发团队证明小参数模型同样能实现复杂任务处理，为资源受限环境下的AI应用提供可行解决方案。

核心研发团队由三位华人科学家领衔，其中Zechun Liu博士担任项目首席研究员。这位复旦大学本科、香港科技大学博士毕业的研究者，在卡内基梅隆大学访学期间师从AI领域顶尖教授，专注于模型量化与高效部署研究。Ernie Chang博士则带来多模态学习领域的丰富经验，其参与的"Agent-as-a-Judge"评估方法开创了模型评测新范式。团队第三位成员Changsheng Zhao博士拥有北京大学与哥伦比亚大学双重学术背景，在三星研究院工作期间积累的产业经验，为其主导的极低比特量化研究提供实践支撑。

技术文档显示，该系列模型架构经过特别优化，在保持轻量化的同时实现高效推理。研发团队通过创新性的神经网络设计，成功平衡模型复杂度与任务处理能力，这种设计哲学或将影响下一代端侧AI模型的开发方向。随着完整技术方案对外公开，学术界正围绕其提出的token效率提升机制展开深入探讨，多个研究团队已启动相关验证实验。

更多>同类资讯

2025 US6小行星身份揭晓：实为中国退役月球卫星DRO-B已移除星表

10-29

从构思到定稿：神舟二十一号载人飞行任务标识诞生背后的故事

10-29

地球曾为高温熔炉？月球起源成谜，月岩锆石藏着宇宙级秘密

10-29

一天之内双喜临门！C909国际化突破与"人造太阳"创纪录共书中国新篇

10-29

太阳终将“熄火”，地球危机四伏，人类太空探索能否开启新希望？

10-29

抖音涨粉实战指南：十大高效路径解析，助你破解内容生态竞争困局

10-29

重庆最新公示！涪陵两企业项目入选市级5G工厂及工业互联网试点

10-29

三只松鼠11月起调整供货价，35款商品涨价0.2元至10元，系成本攀升所致

10-29

宋城演艺前三季度业绩承压，上海桂林项目增长亮眼新项目稳步推进

10-29

新消费浪潮涌动：黄金潮玩奶茶崛起，富豪榜新面孔折射行业变迁

10-29

500亿浦发转债完成转股收官资本补充与股权结构优化双丰收

10-29

英伟达发布NVQLink架构，助力量子处理器与GPU计算深度融合发展

10-29

豆包接入抖音商城开启带货模式：AI与电商融合新探索

10-29

英伟达NVQLink架桥：量子处理器与GPU超级计算机携手开启计算新时代

10-29

从奶茶到啤酒，蜜雪冰城跨界入局，背后藏着怎样的商业新逻辑？

10-29

点击查看更多 +

全站最新

比亚迪首款纯电K-Car“RACCO”官图发布，明年夏季进军日本市场，续航约180km

东京车展雷克萨斯大放异彩，三款LS概念车登场，六轮面包车成焦点

全新问界M7上市36天交付破2万：产能爬坡，跨年补贴至高1.5万元

东风睿立达V8E明窗版江苏上市凭五大优势成全场景新能源VAN优选

2025东京车展：日产全新Elgrand首发，融合日本美学与先进科技

2025东京车展：比亚迪RACCO全新K-Car登场专为日本市场打造

热门内容

本栏最新

张雪峰多平台社媒账号恢复关注功能，此前曾遇异常状态

义乌全球数贸中心盛大启幕，经营户热情满满开启新市场篇章

王自如“入职”雷鸟创新，AI创业沉寂后回归数码圈引关注

‍小米车主网络攻击援助进展：6032人参与，480人提交证据及援助需求‍

黄仁勋长女Madison首秀直播携手光轮智能共探机器人仿真新路径

智元机器人发布精灵G2人形新品，适配多场景且已揽获数亿元订单

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.