ITBear旗下自媒体矩阵:

蚂蚁开源全球首个万亿参数混合线性思考模型,多项性能达开源领先

   时间:2026-02-14 00:01:20 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁集团近日宣布开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T,该模型在生成效率、推理深度和长时程任务执行能力三大核心指标上实现突破性进展,尤其在数学竞赛和复杂任务规划领域达到行业领先水平。

在数学推理能力验证中,Ring-2.5-1T在国际数学奥林匹克竞赛(IMO 2025)自测中取得35分(满分42分),中国数学奥林匹克(CMO 2025)自测获得105分(满分126分),均达到金牌标准。对比前代模型Ring-1T,新模型在推理逻辑严谨性、高级数学证明技术应用和答案完整性方面显著提升。在编程能力测试中,该模型在LiveCodeBench-v6代码生成基准上超越所有对比模型,展现出强大的逻辑构建能力。

技术架构层面,Ring-2.5-1T采用创新的Ling 2.5混合线性注意力机制,将传统GQA(分组查询注意力)升级为MLA(多头线性注意力)与Lightning Linear结构的1:7组合。这种设计使模型在处理32K以上长文本时,内存访问开销降低至前代的十分之一,生成吞吐量提升3倍以上。通过大规模异步智能体强化学习训练,模型在跨应用工具协作和复杂任务执行方面取得突破,在Gaia2-search智能体搜索任务中达到开源模型最优性能。

性能对比实验显示,在配备8块H20-3e GPU的测试环境中,当生成长度超过16K tokens时,Ring-2.5-1T的解码吞吐量较Kimi K2架构提升40%以上;在H200 GPU集群上,这一优势随着序列长度增加进一步扩大。模型激活参数规模从510亿提升至630亿,但通过KV缓存压缩技术,有效控制了计算资源消耗,在1T总参数量下实现更高的推理效率。

该模型已实现与Claude Code智能体编程框架和OpenClaw个人AI助手的深度适配,支持多步规划与工具调用。在软件工程任务测试中,Ring-2.5-1T在SWE-Bench Verified基准上取得显著进步,能够自主完成代码调试、依赖管理和跨文件修改等复杂操作。模型权重与推理代码已在Hugging Face和ModelScope平台开放下载,官方交互体验页面和API服务即将上线。

行业分析指出,Ring-2.5-1T通过底层架构创新,有效解决了传统模型在处理超长文本时的算力成本高、响应延迟大等问题。其混合线性注意力机制为行业提供了新的技术路径,在保持模型性能的同时,显著降低了长序列推理的硬件需求,这对推动AI大模型从短对话向长文档处理、跨模态分析等场景延伸具有重要意义。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version