ITBear旗下自媒体矩阵:

蚂蚁集团推出万亿参数思考模型Ring-2.5-1T,破解深度思考模型“不可能三角”难题

   时间:2026-02-15 00:00:43 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

深度思考模型领域长期存在一个棘手难题:若要实现严密的推理逻辑,就必须承受极慢的解码速度和巨大的显存消耗。为突破这一困境,目前行业普遍采用混合专家模型(MoE)架构,通过激活部分参数来节省算力,DeepSeek、Kimi、MiniMax等头部模型均采用此架构。

如今,蚂蚁集团为这一难题提供了全新解法。该集团正式开源了全球首个基于混合线性架构的万亿参数思考模型——Ring-2.5-1T。这一模型成功实现了推理速度快、深度思考强、长程任务执行能力突出的三重突破,打破了以往深度思考模型难以兼顾这三项性能的局限。

在性能评测中,Ring-2.5-1T表现亮眼。在数学竞赛领域,它在国际数学奥林匹克竞赛(IMO)中取得35分(满分42分),达到金牌水平;在中国数学奥林匹克竞赛(CMO)中斩获105分,远超国家集训队分数线。在长文本生成场景中,面对32K以上的长文本,其访存规模仅为上一代的十分之一,生成吞吐量提升超过3倍,在搜索、编码等复杂任务中展现出强大实力。

Ring-2.5-1T的速度优势源于其底层架构的创新。该模型基于Ling 2.5架构,采用混合线性注意力机制,以1:7的比例混合MLA(多头潜在注意力)和Lightning Linear Attention两种注意力模块。这一设计源自蚂蚁此前发布的Ring-flash-linear-2.0技术路线。研发团队通过增量训练,将原有架构中的GQA(分组查询注意力)层转化为Lightning Linear Attention和MLA:前者负责在长程推理中提升吞吐量,后者则极致压缩KV Cache。为防止模型表达能力因架构改造受损,团队还适配了QK Norm和Partial RoPE等特性。经过改造,Ring-2.5-1T的激活参数量从上一代的51B提升至63B,但凭借线性时间复杂度的特性,推理效率大幅提升。与同为1T参数量级、仅有32B激活参数的Kimi K2架构相比,Ling 2.5架构在长序列推理任务中的吞吐优势显著,且随着生成长度增加,效率优势持续扩大。这意味着长程推理不再是高成本、高硬件要求的操作,而是可以规模化部署的轻量级方案。

在思维训练方面,Ring-2.5-1T在RLVR(基于可验证奖励的强化学习)基础上引入密集奖励机制。与传统仅关注最终答案正确性的方式不同,该机制会逐步考察推理过程中每个环节的严谨性,使模型在逻辑漏洞和高阶证明技巧上得到显著提升。团队还引入大规模全异步Agentic RL训练,大幅增强了模型在搜索、编码等长链条任务上的自主执行能力,让Ring-2.5-1T从单纯的数学证明高手进化为能在复杂实战场景中独当一面的智能体。

在与开源模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking,以及闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等对比中,Ring-2.5-1T在高难度推理任务(如IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench)和长时任务执行基准(如Gaia2-search、Tau2-bench、SWE-Bench Verified)上,均达到开源最优水平。在Heavy Thinking模式下,Ring-2.5-1T在多项数学竞赛和代码生成基准中超越所有对比模型,包括上述闭源API。尤其在IMO 2025(满分42分)中取得35分,达到金牌水平;在CMO 2025(满分126分)中获得105分,大幅超过金牌线78分和国家集训队选拔线87分。与上一代Ring-1T相比,新模型在推理逻辑的严谨性、高级证明技巧的运用和答案表述的完整性上均有明显进步。

在生态适配与开源落地方面,Ring-2.5-1T已适配Claude Code和OpenClaw等主流智能体框架,支持多步规划与工具调用。模型权重与推理代码已在Hugging Face、ModelScope等平台同步开放,官方Chat体验页和API服务也即将上线。除Ring-2.5-1T外,蚂蚁集团同期还发布了扩散语言模型LLaDA2.1和全模态大模型Ming-flash-omni-2.0。LLaDA2.1采用非自回归并行解码技术,推理速度达535 tokens/s,在Humaneval+编程任务中甚至达到892 tokens/s,还具备独特的Token编辑与逆向推理能力;Ming-flash-omni-2.0则在视觉、音频、文本的统一表征与生成上实现突破,打通多模态的感知与创作能力,支持实时感官交互。蚂蚁inclusionAI团队计划将这些能力做成可复用的底座方案,为开发者提供统一的能力入口,并将在视频时序理解、复杂图像编辑和长音频实时生成等方向持续发力,推动全模态技术的规模化落地。

随着AI大模型应用场景从短对话向长文档处理、跨文件代码理解、复杂任务规划等领域延伸,深度思考模型的效率瓶颈愈发突出。Ring-2.5-1T通过底层架构的重构,为行业提供了一条兼顾性能、成本与扩展性的技术路径,有望推动深度思考模型在更多领域的应用。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version