滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

蚂蚁开源万亿参数思考模型Ring-1T，IMO解题达银牌水平，性能直追GPT-5

时间：2025-10-14 11:35:02 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

蚂蚁集团旗下百灵团队近日在人工智能领域取得重大突破，其自主研发的万亿参数思考模型Ring-1T正式对外发布，并同步开源模型权重与训练框架。这款基于大规模可验证奖励强化学习（RLVR）技术的模型，在自然语言推理、复杂数学解题等核心能力上展现出显著优势，成为全球首个具备国际数学奥林匹克竞赛（IMO）获奖水平的开源系统。

在数学推理能力验证中，研究团队将Ring-1T接入多智能体框架AWorld，采用纯自然语言推理方式挑战IMO2025赛题。实验数据显示，模型首次尝试即成功解答第1、3、4、5题，达到IMO银牌标准；第三次尝试时，其针对第2题几何证明给出的推导过程获得接近满分的评价。尽管在第六题中给出的"4048"与正确答案"2112"存在偏差，但该结果已与顶流商业模型Gemini 2.5 Pro持平，而同期测试的其他主流模型在该题上几乎全军覆没。

技术架构层面，Ring-1T通过双重创新突破行业瓶颈。针对万亿参数模型训练中普遍存在的训推精度差异问题，研发团队提出"棒冰（icepop）"算法，利用带掩码的双向截断技术将训练-推理分布差异控制在极低水平，确保长序列训练的稳定性。在强化学习系统优化方面，自研的ASystem平台（含开源框架AReaL）通过显存碎片秒级回收、权重零冗余交换等技术，使单机训练效率提升300%，将大规模RL训练转化为常规操作。

通用能力评估显示，Ring-1T在多个权威测试中表现优异。在"人类偏好对齐"测试Arena-Hard V2中，模型以81.59%的成功率位居开源模型榜首，与GPT-5-Thinking(High)的82.91%仅有微小差距；在医疗问答专项测评HealthBench中，更以绝对优势领跑开源领域。这些成绩验证了模型在严谨专业场景下的可靠性和适应性。

产品矩阵建设方面，蚂蚁百灵团队已形成覆盖160亿至1万亿参数的完整模型体系。继9月30日发布预览版Ring-1T-preview后，此次推出的完整版Ring-1T标志着团队在思考模型领域的首次成功实践。值得注意的是，10月9日发布的万亿参数通用大模型Ling-1T作为非思考型模型，与Ring-1T形成互补，共同构建起蚂蚁集团的大模型技术生态。

目前，开发者可通过HuggingFace、魔搭社区等平台获取Ring-1T模型资源，并借助蚂蚁百宝箱等工具进行在线体验。百灵团队透露，后续版本将持续优化模型性能，重点提升复杂逻辑推理和跨领域知识迁移能力。随着18款模型的陆续发布，蚂蚁集团在万亿参数大模型领域的领先地位得到进一步巩固。

更多>同类资讯

大疆Osmo Pocket 4发布，售价2999元起

04-17

网友担心明日直播引来黑稿，雷军：不能因为有黑稿我们就不说话了

04-17

雷军：未来几年小米不会推出10万元以内车型

04-17

雷军：有友商把我叫做「营销大师」，这是「阴谋诡计」

04-17

特斯拉Cybertruck销量虚高：SpaceX购买了1279辆

04-17

刚刚，Claude Opus 4.7突然发布：不是最强，但奥特曼又得失眠

04-17

Gucci将与谷歌推出AI智能眼镜

04-17

iOS 27四大AI新功能曝光：钱包自动扫码存票、Safari智能命名标签

04-17

报告称苹果与谷歌推荐AI「脱衣」应用

04-17

别人的AI开始自己赚钱了！戒熬夜Skill爆火、解密背后的ClawTip

04-17

智元生态再扩容，旗下觅蜂科技抢滩具身智能数据赛道

04-17

今日大厂员工事：字节数分大佬Pai离职

04-17

直播说错话可能被黑！雷军回应为什么要做续航直播

04-17

雷军：有人想制造小米汽车“营销好”的刻板印象

04-17

雷军称油价飞涨开电车省钱：一个月省大几千

04-17

点击查看更多 +

全站最新

高德机器狗街头亮相：等红灯避行人，还能进店自主取奶茶

存储大牛股突遭减持，多名股东纷纷“跑路”！

A股商业航天股集体上涨，蜀道装备、华光新材涨超7%

A股锂矿股多数上涨，西藏珠峰、融捷股份涨超6%

港股异动丨粤港湾控股大涨超10%，股价创逾8年新高，核心业务盈利性落地获验证

A股异动丨3月地产销售量价边际改善，地产股集体走强，新城控股涨超4%，招商蛇口涨超3%

热门内容

本栏最新

雷军亲测小米新SU7！15小时直播北京至上海，仅中途充1次电能否成功？

雷军谈油价上涨：开电车每月省千元维护费，直面舆情力推产品

11.58万起预售！埃安N60携激光雷达入场开启高阶智驾普惠新时代

11.58万起售埃安N60携激光雷达与高阶智驾紧凑级纯电SUV新选择

东风商用车交付150台牵引车自动驾驶移动空间等多领域科技新动态来袭

雷军再回应“营销大师”标签：表面夸赞实则抹黑

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.