滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

蚂蚁技术研究院发布LLaDA2.0：业内首推100B扩散语言模型并开源

时间：2025-12-13 00:29:49 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

蚂蚁技术研究院近日正式发布全新离散扩散大语言模型LLaDA2.0系列，包含160亿参数的MoE架构mini版本与1000亿参数的flash版本。该成果被业界视为扩散模型领域的重要突破，首次将此类模型的参数规模推进至千亿量级，同步公开的技术报告显示其多项性能指标超越传统自回归模型。

研发团队通过创新架构设计突破了扩散模型扩展瓶颈。LLaDA2.0采用混合专家（MoE）架构，在保持模型灵活性的同时实现参数高效利用。其中100B版本凭借独特的参数扩展方案，成功将扩散模型的训练规模提升至传统架构难以企及的千亿级别，为超大规模语言模型开辟了新的技术路径。

在性能验证环节，该模型展现出显著优势。通过WSD持续预训练策略，新模型可直接继承现有自回归模型的知识体系，避免重复训练带来的资源消耗。结合置信度感知并行训练（CAP）与扩散模型专用优化算法，模型在保证生成质量的前提下，解码速度较传统自回归模型提升2.1倍，特别在代码生成、数学推理等结构化任务中表现突出。

多维度评估数据显示，LLaDA2.0在代码生成任务中展现出独特优势，其生成的代码结构完整性较同类模型提升18%。在数学推理和智能体交互等复杂场景中，模型性能与主流开源自回归模型持平，而在特定结构化输出任务中则表现出更强的生成稳定性。这种差异化优势为不同应用场景提供了新的技术选择。

为推动技术普惠，研究团队已将16B和100B两个版本的模型权重及训练代码完整开源至Huggingface平台。此举不仅降低了超大规模模型的技术门槛，更为学术界和产业界提供了可复现的研究基准。开发者可基于开源框架进行二次开发，探索扩散模型在更多垂直领域的应用可能性。

更多>同类资讯

71岁王健林贵州现身调研文旅，亲赴一线谋突破，奋进姿态令人钦佩

02-02

ASML等巨头齐发声：晶圆厂容量成芯片制造商扩产关键制约因素

02-02

研报掘金丨华源证券：首予招商蛇口“买入”评级，深耕核心城市，央企平台优势凸显

02-02

研报掘金丨华鑫证券：维持博纳影业“买入”评级，看2026年内容新产品与AI新驱动

02-02

研报掘金丨华鑫证券：维持芒果超媒“买入”评级，小芒电商在2025年首次年度盈利

02-02

研报掘金丨国海证券：首予洪都航空“买入”评级，未来几年业绩弹性或较大

02-02

研报掘金丨国海证券：维持福田汽车“买入”评级，2025年业绩预计创14年来新高

02-02

研报掘金丨国海证券：首予若羽臣“买入”评级，业绩近年来持续高增

02-02

研报掘金丨国盛证券：首予圣晖集成“买入”评级，看好后续美国区域业务突破带动业绩增长

02-02

德州仪器2025年数据中心业务表现亮眼收入同比增64%成增长新引擎

02-02

无人机热射流技术显神通浙江特高压线路除冰有了新利器

2月1日，在海拔600余米的浙江省杭州市临安区太阳镇鹤岭村，国网杭州供电公司采用无人机热射流带电除冰技术，对±800千伏灵绍线3060号杆塔的绝缘子开展除冰作业。此次成功应用是浙江省内首次将无人机热射流技术用…

02-02

虚拟现实赋能未成年安全教育：构建深度交互式素养培育新生态

青少年法治安全教育基地采用现代化数字设备以未成年人法治教育知识为重点，智小鱼智能科技通过案例解说、教育短片、互动问答等形式让青少年在潜移默化的过程中参与到法治教育的学习中，养成遵纪守法的好习惯，从而提高青少…

02-02

2026广州世界元宇宙数字生态博览会：探秘VR与AR前沿科技盛宴

对于所有关注VR、AR技术发展及其在元宇宙领域应用的专业人士与爱好者而言，这无疑是一个不容错过的交流与观察窗口。 1.信息获取与登记：关于博览会的具体展商名录、详细活动日程表、场馆分区图等信息，建议通过其官方…

02-02

何朝晖率队赴长沙考察共谋娄底产学研合作与科创平台新发展

在岳麓山前沿交叉科学技术创新中心，何朝晖和湖南低空集团、长沙星空泛连科技有限公司、千寻位置长沙研究院等专家团队座谈，围绕“山货下山、鲜货进城”低空物流航线建设进行深入交流探讨。何朝晖表示，发展低空经济是娄底…

02-02

复古与现代碰撞：日本爱好者打造巨型U盘，128字节磁芯存储引关注

此外，存储在该驱动器上的数据是非易失性的（优点），但在读取过程中位会被擦除（缺点）。当然，这个项目的核心初衷更多是“我能不能做出来”，而非“我该不该做”，因为一个体积硕大、仅搭载 128 字节准非易失性内存…

02-02

点击查看更多 +

全站最新

小米高寒测试新车露面小蓝灯点亮疑似首款增程SUV“YU9”将至

小米新车高寒测试进行时 4台伪装SUV亮相或含首款增程YU9

小米高寒测试新车曝光，小蓝灯点亮，多款新车计划或含首款增程SUV YU9

胡峥楠微博预热：小米全新伪装测试车亮相，YU9增程SUV或成焦点

顺为资本合伙人晒小米YU9冬测照漠河至黑河极寒验证三电可靠性

金价大回撤之下，还能购买么？

热门内容

本栏最新

金价大回撤之下，还能购买么？

港股异动丨石油股继续走低美伊现谈判迹象国际油价大跌4%

港股异动丨内房股普跌野村指内房“三道红线”披露放宽仅具象征意义实质政策松绑有限

A股异动丨航天宏图20cm跌停业绩预亏或被实施退市风险警示

优彩资源(002998.SZ)：取得多项授予发明专利权通知书

港股异动丨濠赌股逆势上涨，澳门1月博彩收入同比增24%胜预期

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.