滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁发布两大万亿参数开源模型，混合线性架构助力效率性能双提升

时间：2026-03-01 12:27:37 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在大模型技术快速迭代的当下，如何在提升模型能力的同时有效控制算力消耗，成为行业关注的焦点。蚂蚁集团最新发布的百灵大模型家族给出了创新性解决方案：通过混合线性注意力架构，在万亿参数规模下实现效率与性能的双重突破。

此次发布的Ling-2.5-1T即时模型与Ring-2.5-1T思考模型，均基于自主研发的Ling 2.5架构。该架构突破传统注意力机制的计算瓶颈，将长文本生成场景的显存占用压缩至传统架构的十分之一，生成吞吐量提升至三倍。这种技术革新使模型在处理复杂任务时，既能保持高精度输出，又能显著降低资源消耗。

在数学竞赛领域，Ring-2.5-1T展现出卓越实力。该模型在国际数学奥林匹克竞赛（IMO 2025）和中国数学奥林匹克（CMO 2025）模拟测试中分别取得35分和105分的优异成绩，达到金牌水平。开启重度思考模式后，其在数学推理和代码生成基准测试中全面超越同类开源及闭源模型，验证了混合架构在复杂推理任务中的优势。

传统注意力机制虽具备强大的语义理解能力，但随着文本长度增加，其计算复杂度呈平方级增长。线性注意力通过数学重构将复杂度降至线性水平，但在处理细粒度语义对齐时存在局限。混合架构通过分层分工策略，在关键层保留传统注意力机制，其余层采用线性计算，实现计算效率与表达能力的动态平衡。

实现万亿参数规模的混合架构面临多重挑战。研究团队通过分组混合设计，在每个层组中配置7层线性注意力与1层传统注意力，经实验验证该比例在高计算预算下性能更优。针对训练稳定性问题，开发团队设计出自适应重计算量化技术，将FP8混合精度训练效率提升50%至70%。推理端则通过优化线性注意力融合算子，支持更多推理模式，进一步提升吞吐量。

在架构改造过程中，研究团队保留了QK归一化、部分旋转位置编码等关键机制，确保模型迁移过程中表达能力不衰减。改造后的Ling-2.5-1T激活参数从510亿增至630亿，但推理吞吐量仍显著提升，证明架构优化收益超过参数增长带来的负担。通过持续预训练和上下文窗口扩展训练，该模型支持最高100万token的超长文本处理。

基准测试数据显示，在AIME 2026评测中，Ling-2.5-1T以平均5890个token的输出长度逼近前沿思考模型水平，而后者需要生成1.5万至2.3万个token才能完成同等任务。在长文本处理基准测试中，该模型在16K至256K token范围内表现优于采用MLA/DSA架构的主流模型。工程实践验证显示，在单机8卡H200配置下，其长文本生成解码吞吐量显著优于前代模型及同等参数量的竞品。

实际应用场景中，优化后的长上下文能力使模型能够处理复杂法律文书和财报分析任务。在知识产权质押纠纷案例中，模型严格遵循10余项多维指令约束，生成逻辑连贯的答复；在财报解读场景中，可一次性完成数十页文档的信息抽取和财务指标计算。这些能力为企业级智能体构建和知识处理自动化提供了技术支撑。

更多>同类资讯

从市值暴跌到年赚近10亿，美图“瘦身”聚焦AI后迎来新增长

04-10

第139届广交会即将启幕：规模创新高，中东客商热情不减共拓商机

04-10

微信回应夫妻AI写公众号年赚200万关联公司成立仅数月引关注

04-10

引望智能技术公司工商变更：朱华荣卸任副董事长张晓宇接任董事

04-10

中国人工智能产业发展联盟发布《OpenClaw类智能体部署风险管理指南》助力安全规范部署

04-10

哈啰Robotaxi布局深圳：成立智能科技公司注册资本达1亿

04-10

值得买科技亮相华为云研讨会：AI赋能营销，共探产业协同新机遇

在具体实践中，通过“值数”AI全域内容洞察平台，值得买科技进一步与华为云实现技术能力与生态的深度协同：一方面实现底层算力与模型能力的适配融合，提升AI应用的部署与运行效率；另一方面将平台在内容生态、用户洞察…

04-10

继远软件新专利：电力客户地址数据治理智能体，缩短异动处理时长降成本

国家知识产权局信息显示，安徽继远软件有限公司申请一项名为“电力客户地址数据治理智能体的构造方法”的专利，公开号CN121834573A，申请日期为2025年11月。通过天眼查大数据分析，安徽继远软件有限公司共…

04-10

中移（杭州）与中国移动申请专利助力大模型跨GPU推理结果一致

国家知识产权局信息显示，中移（杭州）信息技术有限公司、中国移动通信集团有限公司申请一项名为“信息处理方法、装置、设备、介质及产品”的专利，公开号CN121833263A，申请日期为2025年12月。通过天眼查…

04-10

富瀚微新专利：安防监控小目标检测精度提升，误报率显著降低

国家知识产权局信息显示，上海富瀚微电子股份有限公司申请一项名为“一种安防监控场景下目标检测任务的误检抑制方法”的专利，公开号CN121837891A，申请日期为2025年12月。通过天眼查大数据分析，上海富瀚…

04-10

山东大学携手两企业获云服务机器人复杂场景视频问答新专利

国家知识产权局信息显示，山东大学、山东芯辰人工智能科技有限公司、山东正晨科技股份有限公司取得一项名为“一种云服务机器人的复杂场景视频问答方法及系统”的专利，授权公告号CN116541490B，申请日期为202…

04-10

卡奥斯双公司联合申请专利，以创新技术提升用户问题应答效率与精准度

国家知识产权局信息显示，卡奥斯物联科技股份有限公司;卡奥斯工业智能研究院（青岛）有限公司申请一项名为“一种用户问题的应答方法、装置、电子设备及存储介质”的专利，公开号CN121833885A，申请日期为202…

04-10

中电国科与天枢纬度携手，获无人机智能决策方法及系统专利

国家知识产权局信息显示，中电国科技术有限公司;天枢纬度（深圳）科技有限公司取得一项名为“基于深度强化学习的无人机智能决策方法及系统”的专利，授权公告号CN121143402B，申请日期为2025年11月。通过…

04-10

中兴通讯发力AI算力赛道：以创新补位，推动通讯与AI深度融合发展

近日，中兴通讯首席发展官崔丽在接受界面新闻等媒体采访时表示，“在我们看来，类OpenClaw智能体产品的下半场，核心一定是生产力转化。” 虽然AI算力是一门复杂的工程学科，但谢峻石认为，这与通信超大规模组网…

04-10

电压测量单元选型指南：从建大仁科到行业巨头的技术适配解析

应用场景：电压测量单元适配银行、电力、通信、军事、航空、铁路等多个行业，核心应用于计算机网络机房、高端 IDC机房、银行机房、电力配电室、应急电源系统、通信机房、通信基站、UPS 机房、蓄电池组机房等场景…

04-10

点击查看更多 +

全站最新

昊铂S600官图亮相！中大型SUV定位纯电增程双动力北京车展揭秘更多

鑫源汽车技术发布：以实用主义为帆携手伙伴为奋斗者造好车

鑫源汽车技术发布：以实用主义为基为奋斗者打造“创富伙伴”

广汽昊铂S600官图亮相中大型SUV定位纯电增程双动力北京车展将揭秘更多

广州小马智行科技公司增资至2亿增幅100%

朱华荣卸任华为引望副董事长

热门内容

本栏最新

9分钟“人车同补”：比亚迪与肯德基跨界，开启汽车后市场新想象

2026嵌入式学习资料怎么选？小智学长VS大厂，谁才是学习利器？

225公里纯电续航加持，吉利银河M7能否在插混SUV市场突围？

微信公众号严打非真人创作：AI代笔文章遭批量删除平台明令禁止

微信公众号出手整治：严禁AI自动化创作替代真人保障内容生态健康发展

普洛斯与华为强强联合，以科技赋能新经济共筑新质生产力未来

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.