ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁集团与清华联手：AReaL框架突破AI推理训练瓶颈，效率飙升2.77倍

时间：2026-03-04 14:38:39 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

蚂蚁集团与清华大学联合宣布，正式推出开源强化学习训练框架AReaL v1.0稳定版。这一系统专为大规模异步强化学习设计，通过彻底解耦数据生成与模型训练流程，显著提升了大语言模型在推理任务中的训练效率，尤其适用于需要处理海量思考Token的复杂场景。

传统强化学习训练系统普遍采用同步机制，要求生成阶段必须等待批次中最慢的输出完成才能启动训练。这种"木桶效应"导致大量GPU资源长期闲置，在处理需要生成数万个思考Token的数学推理或代码生成任务时，效率瓶颈尤为突出。研究团队指出，同步系统的硬件利用率不足问题已成为制约大模型训练规模扩展的关键因素。

AReaL系统采用完全异步架构，通过流水线式并行设计打破传统限制。生成工作器可持续不断产生新数据，训练工作器则在数据积累到阈值后立即启动模型更新，两个环节完全独立运行。这种设计消除了同步等待时间，使硬件资源利用率提升数倍，训练过程呈现连续流畅特征。实验数据显示，在相同GPU配置下，系统处理复杂推理任务的速度较主流同步方案提升最高达2.77倍。

针对异步训练带来的数据"陈旧度"挑战，研发团队创新性地提出陈旧度感知训练机制。该机制通过动态调整工作负载分配，在保证训练稳定性的同时最大化数据新鲜度。系统还引入解耦PPO目标函数与可中断生成技术，允许模型在生成过程中实时接收权重更新，彻底消除传统方案中"生成-训练"的割裂状态。

性能验证显示，AReaL在数学推理（GSM8K、MATH）和代码生成（Humaneval）等基准测试中表现优异。除训练速度显著提升外，模型在部分任务中的解题准确率反而出现增长。研究团队认为，异步架构带来的持续数据流动和模型更新，可能有助于大语言模型保持更优的推理状态。该框架现已开源，开发者可通过指定渠道获取完整代码与文档。

更多>同类资讯

AI赋能短剧出海新机遇：广州企业订单激增，全年增幅或达50倍

05-27

AMD苏姿丰为Zen 7布局：牵手台积电A14工艺力成FOPLP封装或成亮点

IT之家 5 月 26 日消息，工商时报昨日（5 月 25 日）发布博文，报道称在 2026 台北国际电脑展（6 月 2~5日）开幕前，AMD 首席执行官苏姿丰已开始为 Zen 7 平台布局铺设供应链，预…

05-27

TetraMem 22nm SoC MLX200完成验证，以存内计算开拓低功耗低延迟AI新赛道

来源：市场资讯（来源：IT之家） IT之家 5 月 26 日消息，硅谷 AI 芯片初创企业 TetraMem 当地时间 19 日宣布，其22nm SoC MLX200 在台积电制程上完成芯片验证，评估套件…

05-27

数字技术助力治理升级厦门翔安智慧城中村项目7月将全面完工

为破解城中村人口密集、设施薄弱、监管难度大、服务覆盖不足等治理难题，近日，厦门市翔安区智慧城中村(三期)项目正加紧推进建设，预计今年7月将全面完工。据厦门智慧翔安数据有限公司智慧城中村项目负责人介绍，全区1…

05-27

机器人与自动化浪潮下：网络安全成企业稳定运营的关键防线

监控异常流量模式：在OT网络中，异常模式往往格外显眼：控制器突然与陌生地址通信、设备在异常时段频繁交互、与正常运营不符的大规模数据传输、反复出现的登录失败，或突然出现的新型管理工具。 A：远程访问是自动化环…

05-27

盟固利：昔日新股王跌宕后横盘两年摩根离场北向广发却加仓布局

05-27

深圳市瑞通精密：四轴CNC加工赋能机器人航空航天医疗设备精密制造

基于上述维度，深圳市瑞通精密机械有限公司在技术协同能力（真空钎焊+四轴CNC）、行业适配经验（20余个行业覆盖）、服务响应机制（全周期服务）等方面表现突出，建议对精度、密封性、材料兼容性要求高的采购方进一步了…

05-27

工业自动化新选择：山东波士顿摆臂机器人，技术实力与服务优势双在线

公开特点：1. 技术研发能力：与山东大学机械工程学院共建联合实验室，持有27项摆臂机器人相关**，每年研发投入占比超营收的12%；2. 行业适配案例：为比亚迪汽车提供定制化摆臂机器人产线，实现发动机缸体装配…

05-27

开源鸿蒙加速布局制造业首台搭载鸿蒙系统无人驾驶清扫车亮相深圳

会上，全国首家且唯一面向制造业的开源鸿蒙创新中心——开鸿启源创新中心（深圳）有限公司（下称“开鸿启源”）正式成立，标志着开源鸿蒙在工业制造核心领域的战略布局进入实质性落地阶段。从开鸿启源创新中心的成立，到…

05-27

宇树科技冲刺A股人形机器人第一股：利润承压下研发加码，行业转型加速

另外一个关键原因就是公司的研发费用同比增加了 3，832.80万元，主要用在了机器人本体与结构研发、具身智能大模型、运动控制算法等领域，和研发团队的扩充。从本体硬件层面来说，宇树科技在这个领域一直以来都…

05-27

机器人与自动化浪潮下，网络安全如何筑牢企业运营防护网？

05-27

映众推出AGS-4UMGX-R1：英伟达Blackwell架构助力企业级AI计算新突破

快科技5月26日消息，映众宣布推出一款型号为AGS-4UMGX-R1的全新企业级NVIDIA MGX 4U GPU服务器。映众推出该产品旨在为AI研究和先进仿真等行业提供兼具性能、可靠性与可扩展性的企业级计…

05-27

联发科与元太科技携手，以技术融合开启生成式AI彩色电子阅读器新篇

IT之家 5 月 26 日消息，联发科技 (Mediatek) 今日宣布与元太科技 (E Ink) 合作，整合双方分别在 SoC和彩色电子纸方面的技术资产，打造面向生成式 AI 时代的彩色电子纸阅读器解决方…

05-27

中国养老服务机器人产业初成体系，今年市场规模有望超百亿

来源：环球网【环球网科技综合报道】5月26日，中国软件评测中心发布的《智能养老服务机器人产业演进与未来趋势研究》报告指出，我国养老服务机器人产业已初步形成体系，正在从“技术验证”阶段向“规模化应用”过渡的…

05-27

支付宝AI支付突破3亿笔大关全球首个大规模商用AI原生支付体系成型

05-26

点击查看更多 +

全站最新

抖音电商重拳出击“假洋牌”：上线新规严核查，倡议达人合规带货护消费权益

拼多多几元包邮商品背后：成本拆解、利润玄机与消费真相大起底

2026年科大讯飞学习机怎么选？这3款高口碑机型，护眼高效助孩子轻松学

2026年科大讯飞学习机怎么选？这三款护眼又智能，助力孩子高效学习！

科大讯飞AI学习机深度评测：三款高性价比之选助力孩子高效学习

科大讯飞学习机深度评测：智能教育新选择，助力孩子高效学习成长

热门内容

本栏最新

零跑D99即将亮相粤港澳车展！舱驾一体+多种空间模式，中旬上市引期待

光互连成AI算力新战场，谢崇进携奇点光子如何抢占窗口期？

昇腾AI开发者峰会2026北京启幕：共探前沿技术，携手开发者共筑AI新未来

支付宝AI支付再突破：3亿笔交易达成，AI钱包与Token Pay引领支付新篇章

零跑D99即将粤港澳车展首秀，舱驾一体设计+多样空间模式，中旬上市引期待

华策影视否认解散电影部门传闻内容战略升级推进影视与AI融合

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.