ITBear旗下自媒体矩阵:

蚂蚁集团发布万亿参数思考模型Ring-2.5-1T,攻克大模型“不可能三角”难题

   时间:2026-02-14 23:19:40 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

深度思考模型领域长期面临一个棘手难题:要在推理逻辑严密性、解码速度和显存开销之间取得平衡几乎不可能。若追求严密的推理逻辑,往往要忍受极慢的解码速度和巨大的显存消耗。为突破这一困境,当前业界大多采用混合专家模型(MoE)架构,通过仅激活部分参数来节省算力,像DeepSeek、Kimi、MiniMax等头部模型均采用了该架构。

如今,蚂蚁集团在这一领域取得重大进展,成功打破行业局限。该集团正式开源了全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T,它同时实现了推理速度快、深度思考能力强、长程任务执行能力突出这三项过去难以同时达成的目标。

在多项评测中,Ring-2.5-1T表现出色。在数学竞赛方面,它在国际数学奥林匹克竞赛(IMO)中取得35分(满分42分),达到金牌水平;在中国数学奥林匹克竞赛(CMO)中拿到105分,远超国家集训队分数线。在长文本生成场景中,对于32K以上的长文本,它将访存规模降至上一代的十分之一,生成吞吐量提升超过3倍,在搜索、编码等复杂任务处理上展现出强大能力。

Ring-2.5-1T的速度优势源于其底层架构的创新。它基于Ling 2.5架构,采用混合线性注意力机制,按照1:7的比例混合多头潜在注意力(MLA)和Lightning Linear Attention两种注意力模块。这一设计借鉴了蚂蚁此前发布的Ring-flash-linear-2.0技术路线。

研发团队运用增量训练方法,将原有架构中的分组查询注意力(GQA)层分别转化为Lightning Linear Attention和MLA。其中,Lightning Linear Attention负责在长程推理中提升吞吐量,MLA则极致压缩KV Cache。为防止架构改造影响模型表达能力,团队还适配了QK Norm和Partial RoPE等特性。经过改造,Ring-2.5-1T的激活参数量从上一代的51B提升至63B,但凭借线性时间复杂度特性,推理效率大幅提高。与同为1T参数量级、激活参数仅32B的Kimi K2架构相比,Ling 2.5架构在长序列推理任务中的吞吐优势明显,且随着生成长度增加,效率优势持续扩大。这意味着长程推理不再是高成本、高硬件要求的操作,而是可规模化部署的轻量级方案。

在思维训练方面,Ring-2.5-1T在基于可验证奖励的强化学习(RLVR)基础上引入密集奖励机制。与传统仅关注最终答案正确与否的方式不同,该机制会逐步考察推理过程每个环节的严谨性,使模型在逻辑漏洞和高阶证明技巧运用上有显著提升。团队还引入大规模全异步Agentic RL训练,大幅增强模型在搜索、编码等长链条任务上的自主执行能力,让模型从单纯的数学证明高手转变为能在复杂实战场景中独当一面的智能体。

蚂蚁研究团队将Ring-2.5-1T与多个开源模型和闭源API进行对比,包括DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等。结果显示,在高难度推理任务如IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench,以及长时任务执行基准如Gaia2-search、Tau2-bench、SWE-Bench Verified上,Ring-2.5-1T均达到开源最优水平。在Heavy Thinking模式下,它在多项数学竞赛和代码生成基准中超越所有对比模型,包括上述闭源API。特别是在IMO 2025中拿到35分达到金牌水平,在CMO 2025中获得105分,大幅超过金牌线78分和国家集训队选拔线87分。与上一代Ring-1T相比,新模型在推理逻辑严谨性、高级证明技巧运用和答案表述完整性上都有明显进步。

在生态适配与开源落地方面,Ring-2.5-1T已适配Claude Code和OpenClaw等主流智能体框架,支持多步规划与工具调用。模型权重与推理代码已在Hugging Face、ModelScope等平台同步开放,官方Chat体验页和API服务也即将上线。

除Ring-2.5-1T外,蚂蚁集团同期还发布了扩散语言模型LLaDA2.1和全模态大模型Ming-flash-omni-2.0。LLaDA2.1采用非自回归并行解码技术,推理速度达535 tokens/s,在Humaneval+编程任务上甚至达到892 tokens/s,还具备独特的Token编辑与逆向推理能力。Ming-flash-omni-2.0在视觉、音频、文本的统一表征与生成上取得突破,打通多模态感知与创作能力,支持实时感官交互。蚂蚁相关团队计划将这些能力做成可复用的底座方案,为开发者提供统一的能力入口,后续还将在视频时序理解、复杂图像编辑和长音频实时生成等方向持续发力,推动全模态技术规模化落地。

随着AI大模型应用场景从短对话向长文档处理、跨文件代码理解、复杂任务规划等方向延伸,深度思考模型的效率瓶颈愈发突出。Ring-2.5-1T通过重构底层架构,为兼顾性能、成本与扩展性提供了技术路径。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version