ITBear旗下自媒体矩阵:

蚂蚁集团开源Ring-1T-preview大模型,AIME等多测试中表现亮眼

   时间:2025-09-30 15:02:22 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁集团旗下蚂蚁百灵研发团队近日宣布,正式开源全球首个万亿参数级别的自然语言推理大模型——Ring-1T-preview。该模型作为万亿参数推理大模型Ring-1T的预览版本,在自然语言处理领域展现出突破性能力,标志着开源社区迎来首个具备万亿级参数的推理专用大模型。

在权威评测中,Ring-1T-preview的表现引发行业关注。该模型在AIME 25数学推理测试中取得92.6分,不仅超越所有已知开源模型,更超过闭源模型Gemini 2.5 Pro,与GPT-5(无工具辅助)94.6分的成绩仅差2分。在编程能力评估平台CodeForces测试中,其94.69分的成绩直接超越GPT-5,显示出强大的代码生成与逻辑推演能力。在LiveCodeBench编程基准测试和ARC-AGI-v1通用人工智能评估中,该模型均位居开源模型榜首。

研发团队透露,Ring-1T-preview的推理能力已通过国际奥林匹克数学竞赛(IMO)的实战检验。在模拟测试中,模型成功一次性完整解答第三题,并在第一、二、四、五题中部分推导出正确答案,展现出对复杂数学问题的分层解析能力。这一成果得益于团队对Ling2.0家族1T语言基座模型的持续优化,通过后训练技术充分释放了万亿参数模型的推理潜能。

目前,蚂蚁百灵团队正全力推进Ring-1T正式版的训练工作。该版本将在预览版基础上进一步优化模型架构,预计将带来更强的逻辑推演、多步推理和跨领域知识迁移能力。随着正式版训练的推进,开源社区有望获得一个更完善的万亿参数推理大模型,为自然语言处理、数学推理、代码生成等领域的研究提供全新工具。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version