ITBear旗下自媒体矩阵:

蚂蚁集团发布开源万亿参数模型Ring-2.5-1T 生成效率与思考深度双提升

   时间:2026-02-13 17:09:07 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁集团近日宣布,正式推出并开源其首个采用混合线性架构的万亿参数思考模型——Ring-2.5-1T。该模型的权重文件与推理代码已同步上线至Hugging Face、ModelScope等国际主流开源平台,官方交互体验页面及API服务接口预计于近期开放。

研发团队通过创新架构设计,在预训练与强化学习阶段实现双重突破。核心突破在于构建了1:7比例的MLA(混合线性注意力)与Lightning Linear Attention协同机制,既保持了传统注意力机制对复杂关系的捕捉能力,又通过线性化改造将显存占用降低一个数量级。配合异步强化学习框架的规模化部署,模型在复杂任务的长程推理能力上取得显著进展。

性能测试数据显示,在超过32K tokens的生成任务中,新模型展现出三倍以上的吞吐量提升,同时将内存访问规模压缩至原有水平的十分之一。这种特性使其在需要深度推理的场景中表现尤为突出,例如在数学竞赛基准测试中,模型通过引入密集奖励机制(dense reward),在自测环节同时达到国际数学奥林匹克(IMO)2025与国际数学奥林匹克中国国家队选拔赛(CMO)2025的金牌标准。

针对实际应用场景,研发团队重点优化了模型的自主执行能力。通过大规模异步智能体强化学习训练,Ring-2.5-1T可无缝对接Claude Code等智能编程框架,并能高效驱动OpenClaw等个人AI助理完成复杂任务流程。在代码生成、逻辑推理等长程任务中,模型展现出超越前代版本(Ring-1T)的持续执行稳定性。

此次开源包含完整的模型权重与推理代码,开发者可基于现有框架进行二次开发。蚂蚁集团表示,此举旨在推动大模型技术向通用智能体方向演进,通过开放核心架构促进产业生态共建。行业分析认为,该模型在长文本处理与复杂推理领域的突破,或将重新定义AI在专业领域的应用边界。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version