滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁技术研究院发布LLaDA2.0 扩散语言模型参数达100B且开源共享

时间：2025-12-12 18:41:23 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

蚂蚁技术研究院近日正式发布全新离散扩散大语言模型系列——LLaDA2.0，同步公开的技术报告显示，该系列包含100B参数的"flash"版本与16B参数的"mini"版本，成为全球首个突破百亿参数的扩散语言模型。这一突破性成果标志着扩散模型在参数规模扩展领域取得重大进展，成功打破业界对扩散模型难以规模化应用的固有认知。

研发团队创新采用混合专家（MoE）架构，通过模块化设计实现模型性能与计算效率的平衡。在训练策略方面，提出的Warmup-Stable-Decay（WSD）持续预训练方法，使新模型能够直接继承现有自回归（AR）模型的知识体系，避免了传统从头训练带来的高昂成本。配合置信度感知并行训练（CAP）与扩散模型专用DPO技术，在保证生成质量的同时，将推理速度提升至AR模型的2.1倍。

多维度评估数据显示，LLaDA2.0在结构化生成任务中表现尤为突出。在代码生成、数学推理及智能体交互等场景下，其性能指标全面超越同级别AR模型，而在自然语言理解等基础能力方面则与开源AR模型持平。这种"专长强化+基础稳固"的特性，为特定领域的大模型应用开辟了新路径。

为推动技术生态发展，研究院已将16B与100B两个版本的模型权重及完整训练代码开源至Huggingface平台。开发者可通过公开资源复现训练过程，或基于现有模型进行二次开发。此次开源不仅降低了超大规模模型的技术门槛，更为学术界提供了研究扩散模型规模化应用的重要样本。

更多>同类资讯

宇树科技王兴兴：具身智能“双80%”达成就迎拐点，未来一两年或迎突破

【环球网科技综合报道】12月12日消息，宇树科技创始人兼首席执行官王兴兴近日在接受央视节目采访时表示，具身智能领域的“ChatGPT时刻”有望在未来一两年内到来。这一判断基于其提出的“双80%”关键指标——当…

12-12

华为擎云HM740亮相鸿蒙电脑专业版赋能政企高效安全办公新体验

12月11日，华为正式公布了其在政企办公领域的两项核心进展——全新商用笔记本华为擎云 HM740 以及鸿蒙电脑专业版操作系统。在操作系统层面，新发布的鸿蒙电脑专业版以 HarmonyOS 6 为底座，深度…

12-12

鸿蒙商用新跨越：鸿蒙电脑企业版与擎云 HM740 开启办公新未来

传统部署模式下，500台电脑的镜像制作、测试验证、分发部署与人工调试需耗时10天，而通过华为HEM云端部署平台，管理员只需几步网页操作，即可完成应用、桌面配置与设备策略的预设置，员工开箱联网后，在启动阶段便能…

12-12

鸿蒙商用新跨越：鸿蒙电脑企业版与擎云 HM740开启办公新未来

传统部署模式下，500台电脑的镜像制作、测试验证、分发部署与人工调试需耗时10天，而通过华为HEM云端部署平台，管理员只需几步网页操作，即可完成应用、桌面配置与设备策略的预设置，员工开箱联网后，在启动阶段便能…

12-12

娱乐巨头联手OpenAI 迪士尼CEO：不愿被技术创新颠覆

12-12

纽约州推出首批人工智能法案，披露AI生成人物片段

12-12

特斯拉劲敌Rivian开发AI芯片计划取代英伟达产品

12-12

台积电熊本晶圆二厂将升级4nm制程

12-12

日产与Wayve签署最终协议：共推下一代驾驶辅助技术

12-12

李飞飞：AI时代，信任绝不能外包给机器，本质属于人类

12-12

不被机器人替代经济学家杨德龙建议：通过资本来投资

12-12

超时免罚全面落地、智能外呼全国上线淘宝闪购持续加码骑士提效增收

12-12

迪士尼CEO鲍勃・艾格谈为何投资OpenAI：若不拥抱技术我们将变得被动

12-12

近乎免费！特斯拉FSD专属保险上线

12-12

宇树科技CEO王兴兴：具身智能“ChatGPT时刻”或在未来一两年到来

12-12

点击查看更多 +

全站最新

新能源售后满意度逆袭传统燃油车汽车服务竞争重心加速迁移

智能座舱生态困局：硬件碎片化、适配成本高，如何破局重构体验？

纵横G700凭全场景实力出圈，续航、舒适、通信全满足，成穿越新宠

GDPS 2025探秘：从插花到救援，具身智能机器人应用加速落地

机器人ETF易方达盘中吸金力强获1700万份净申购产业前景受关注

麦克斯韦国际北京设金融创新基地创始人马鑫将捐百所图书馆助公益

热门内容

本栏最新

山东首富跨界转型：借北汽制造“拼车” 另辟蹊径寻车市突破

3000万辆里程碑！中国长安以“长安速度”书写汽车产业新辉煌

协作型智能体时代来临：多智能体协作重塑产业新生态

岚图追光L上市，27.99万起售，能否在中大型轿车市场掀起波澜？

英飞凌OptiMOS 7功率MOSFET发布，为多领域应用带来性能新突破

领益智造递交H股上市申请，业务多点开花启动“A+H”双平台新篇

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.

蚂蚁技术研究院发布LLaDA2.0 扩散语言模型 参数达100B且开源共享

蚂蚁技术研究院发布LLaDA2.0 扩散语言模型参数达100B且开源共享