蚂蚁集团旗下百灵大模型团队宣布,其研发的Ling-2.6-1T大模型正式面向全球开发者开源。该模型突破传统大模型单纯追求参数规模的路径,通过系统性优化核心能力,在真实复杂任务场景中展现出显著优势,为万亿级参数模型的工程化落地提供了新范式。
在技术架构层面,研发团队创新采用MLA与Linear Attention混合架构,结合动态过程冗余抑制策略,使模型在保持1T参数性能上限的同时,大幅降低对冗长推理链的依赖。这种"快思考"机制通过优化计算路径,在同等智能水平下将输出成本压缩30%以上,特别适用于需要即时响应的交互场景。
针对复杂任务处理,模型构建了多维度能力矩阵。在Agent协作、代码生成及工作流管理等场景中,通过强化复合任务学习能力,实现了对指令序列、工具调用、上下文状态的全流程把控。在AIME26、SWE-bench Verified等权威基准测试中,该模型以显著优势刷新开源模型纪录,尤其在噪声环境下的推理准确率较前代提升22%。
工程化落地能力是该模型的核心突破。团队开发了从代码生成到缺陷修复的完整工具链,模型可无缝集成至主流Agent框架,支持多工具协同、多步骤推理及动态约束处理。在金融、物流等行业的压力测试中,模型在保持99.9%可用性的同时,将复杂业务场景的适配周期从月级缩短至周级。
为降低开发者体验门槛,项目组同步延长OpenRouter平台免费API服务期限,并提供分层次的模型裁剪方案。开发者既可直接调用完整版模型,也可根据硬件条件选择精简版本,最小部署需求较同类模型降低60%。目前,模型已在Hugging Face和ModelScope平台同步上线,提供完整的训练日志与微调指南。
开源版本包含模型权重、推理代码及基准测试套件,支持商业应用与二次开发。技术文档显示,该模型在长文本处理方面表现突出,可稳定处理16M tokens规模的输入,在法律文书分析、科研论文解读等场景中展现出专业级理解能力。项目组表示将持续更新工具生态,未来三个月内将推出行业适配插件市场。











