滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁集团推出万亿参数思考模型Ring-2.5-1T，破解深度思考模型“不可能三角”难题

时间：2026-02-15 00:00:43 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

深度思考模型领域长期存在一个棘手难题：若要实现严密的推理逻辑，就必须承受极慢的解码速度和巨大的显存消耗。为突破这一困境，目前行业普遍采用混合专家模型（MoE）架构，通过激活部分参数来节省算力，DeepSeek、Kimi、MiniMax等头部模型均采用此架构。

如今，蚂蚁集团为这一难题提供了全新解法。该集团正式开源了全球首个基于混合线性架构的万亿参数思考模型——Ring-2.5-1T。这一模型成功实现了推理速度快、深度思考强、长程任务执行能力突出的三重突破，打破了以往深度思考模型难以兼顾这三项性能的局限。

在性能评测中，Ring-2.5-1T表现亮眼。在数学竞赛领域，它在国际数学奥林匹克竞赛（IMO）中取得35分（满分42分），达到金牌水平；在中国数学奥林匹克竞赛（CMO）中斩获105分，远超国家集训队分数线。在长文本生成场景中，面对32K以上的长文本，其访存规模仅为上一代的十分之一，生成吞吐量提升超过3倍，在搜索、编码等复杂任务中展现出强大实力。

Ring-2.5-1T的速度优势源于其底层架构的创新。该模型基于Ling 2.5架构，采用混合线性注意力机制，以1:7的比例混合MLA（多头潜在注意力）和Lightning Linear Attention两种注意力模块。这一设计源自蚂蚁此前发布的Ring-flash-linear-2.0技术路线。研发团队通过增量训练，将原有架构中的GQA（分组查询注意力）层转化为Lightning Linear Attention和MLA：前者负责在长程推理中提升吞吐量，后者则极致压缩KV Cache。为防止模型表达能力因架构改造受损，团队还适配了QK Norm和Partial RoPE等特性。经过改造，Ring-2.5-1T的激活参数量从上一代的51B提升至63B，但凭借线性时间复杂度的特性，推理效率大幅提升。与同为1T参数量级、仅有32B激活参数的Kimi K2架构相比，Ling 2.5架构在长序列推理任务中的吞吐优势显著，且随着生成长度增加，效率优势持续扩大。这意味着长程推理不再是高成本、高硬件要求的操作，而是可以规模化部署的轻量级方案。

在思维训练方面，Ring-2.5-1T在RLVR（基于可验证奖励的强化学习）基础上引入密集奖励机制。与传统仅关注最终答案正确性的方式不同，该机制会逐步考察推理过程中每个环节的严谨性，使模型在逻辑漏洞和高阶证明技巧上得到显著提升。团队还引入大规模全异步Agentic RL训练，大幅增强了模型在搜索、编码等长链条任务上的自主执行能力，让Ring-2.5-1T从单纯的数学证明高手进化为能在复杂实战场景中独当一面的智能体。

在与开源模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking，以及闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等对比中，Ring-2.5-1T在高难度推理任务（如IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench）和长时任务执行基准（如Gaia2-search、Tau2-bench、SWE-Bench Verified）上，均达到开源最优水平。在Heavy Thinking模式下，Ring-2.5-1T在多项数学竞赛和代码生成基准中超越所有对比模型，包括上述闭源API。尤其在IMO 2025（满分42分）中取得35分，达到金牌水平；在CMO 2025（满分126分）中获得105分，大幅超过金牌线78分和国家集训队选拔线87分。与上一代Ring-1T相比，新模型在推理逻辑的严谨性、高级证明技巧的运用和答案表述的完整性上均有明显进步。

在生态适配与开源落地方面，Ring-2.5-1T已适配Claude Code和OpenClaw等主流智能体框架，支持多步规划与工具调用。模型权重与推理代码已在Hugging Face、ModelScope等平台同步开放，官方Chat体验页和API服务也即将上线。除Ring-2.5-1T外，蚂蚁集团同期还发布了扩散语言模型LLaDA2.1和全模态大模型Ming-flash-omni-2.0。LLaDA2.1采用非自回归并行解码技术，推理速度达535 tokens/s，在Humaneval+编程任务中甚至达到892 tokens/s，还具备独特的Token编辑与逆向推理能力；Ming-flash-omni-2.0则在视觉、音频、文本的统一表征与生成上实现突破，打通多模态的感知与创作能力，支持实时感官交互。蚂蚁inclusionAI团队计划将这些能力做成可复用的底座方案，为开发者提供统一的能力入口，并将在视频时序理解、复杂图像编辑和长音频实时生成等方向持续发力，推动全模态技术的规模化落地。

随着AI大模型应用场景从短对话向长文档处理、跨文件代码理解、复杂任务规划等领域延伸，深度思考模型的效率瓶颈愈发突出。Ring-2.5-1T通过底层架构的重构，为行业提供了一条兼顾性能、成本与扩展性的技术路径，有望推动深度思考模型在更多领域的应用。

IT之家 6 月 28 日消息，法拉第未来宣布于 6 月 23 日在芝加哥 Automate 机器人与自动化展会上发布“全美首款工业级轮臂机器人Faber”，并预告 FF EAI 机器人工业生态战略，称“六…

06-28

AI短剧，今年最大融资出现了

06-28

梁文锋署名的DSpark，看懂这10个点就够了！

06-28

AI浪潮来袭，通信行业如何借力重构模式，开启智能新篇章？

一位通信设备厂商的技术负责人对第一财经记者表示，从经营流量到经营Token，包括运营商在内的通信产业链玩家不再甘于只做个连接服务商。“过去几年，5G提供了差异化服务的机会，但真正完成5G独立组网、能够把网络能…

06-28

Anthropic调研：约半数用户称AI已可承担一半以上的工作

06-28

DeepSeek推理提速80%，DSpark到底做对了什么？

06-28

“77万条未读消息”背后，是技术缺失的温度

06-28

梁文锋署名的DSpark，看懂这10个点就够了

06-28

管制有望放宽 Anthropic Fable 5最快下周恢复公众访问

06-28

iOS 27深化与Apple Intelligence整合 1H27新款低阶iPhone DRAM升级至9GB

06-28

卡萨帝：20年坚守“慢哲学”，以长期主义铸就高端引领传奇

06-28

第五届数字信任大会聚焦AI融合发布双文件助力数智信任体系构建

06-28

存储行业景气上行晶圆扩产与长协驱动半导体市场持续向好

06-28

神舟二十三乘组在轨满月：科学实验稳步推进太空生活添新趣吃上烤南瓜

IT之家从视频获悉，在轨脑电测试研究相关实验进展顺利，三名航天员利用脑电采集设备开展视觉运动、加工照明、行为反应等多项实验测试。在健康管理方面，乘组使用中医四诊仪采集相关数据信息，为科研人员实施航天员长期…

06-28

神舟二十三号乘组在轨满月：空间实验稳步推进太空生活精彩纷呈

神二十三号乘组和机器人“小航”进行互动，开展触碰交互测试，采集相关数据用于优化后续在轨机器人运动行为规划方法。三名航天员利用脑电采集设备开展视觉运动加工、照明行为反应等多项实验测试，地面科研人员将依托下行数…

06-28

点击查看更多 +

全站最新

宝马乘胜追击！全新长轴距版X5将引入印度，此前多款长轴车型已获成功

长途驾驶选国道？先掌握这4个技巧，否则高速更稳妥安全！

捷途旅行者8敦煌亮相！前路虎设计总监操刀，30万级越野市场新角逐？

比亚迪自研璇玑A3芯片明年将首搭腾势新车，算力超2100TOPS引期待

全新Q05乌兹别克斯坦上市，长安启源借势加速布局全球新能源市场

名爵MG07旅行车渲染图曝光，15万级“猎装平替”或成市场新宠？

热门内容

本栏最新

AI浪潮来袭，通信行业如何借力重构模式，开启智能新篇章？

AI浪潮席卷通信业：从“卖连接”到“卖智能”，新价值如何破局？

吉林建科携手华为共探数智人才培养新路径助力区域数字经济高质量发展

尊界S800典藏大观亮相：余承东“双态”发布，中国超豪华车新征程启幕

敦煌大漠燃情夜：许巍助阵捷途“方盒子”燃油插混双车闪耀登场

360潘剑锋：智能体时代安全新范式，聚焦驾驭AI不确定性难题

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.