全球通用语言模型领域迎来重要突破——蚂蚁集团正式发布并开源其首个万亿参数大模型Ling-1T。作为蚂蚁百灵大模型Ling 2.0系列的首款旗舰产品,该模型凭借1.2万亿参数规模,成为当前非思考类大模型中的性能标杆。
基准测试显示,Ling-1T在有限输出Token条件下展现出显著优势。在竞赛数学基准AIME 25测试中,该模型以平均4000+ Token消耗达到70.42%准确率,超越消耗5000+ Token、准确率70.10%的Gemini-2.5-Pro。在代码生成、专业数学推理等12项高难度任务中,Ling-1T均取得开源模型领先成绩,特别是在前端开发能力基准ArtifactsBench上以59.31分位居榜首。
技术架构方面,Ling-1T延续Ling 2.0架构,在20万亿Tokens的高质量推理语料上完成预训练。模型支持128K上下文窗口,通过"中训练+后训练"的演进式思维链技术,显著提升复杂推理效率。值得关注的是,该模型全程采用FP8混合精度训练,成为已知规模最大的FP8训练基座模型,显存节省达30%,训练速度提升15%以上。
蚂蚁百灵团队创新提出的LPO策略优化算法(LingPO),以句子为粒度进行参数更新,有效解决了万亿参数模型的训练稳定性问题。同时,团队开发的混合奖励机制在确保代码正确性的基础上,显著提升了模型对视觉美学的理解能力。这些技术突破使Ling-1T在保持高性能的同时,降低了对高端GPU的依赖。
在AI军备竞赛持续升级的背景下,蚂蚁集团的技术路线引发行业关注。与依赖高性能GPU的混合专家(MoE)模型不同,Ling-1T通过优化异构计算框架,实现了在普通加速器上的高效训练。这种技术路径与蚂蚁集团CTO何征宇的布局密切相关——这位佐治亚理工学院博士、前谷歌gVisor项目负责人,正带领团队探索生活服务、金融、医疗等场景的AI应用。
全球AI投资格局也在发生深刻变化。据PitchBook统计,今年AI领域初创公司已吸引1927亿美元风险投资,占全球风投总额的53%。美国市场表现尤为突出,62.7%的风投资金流向AI企业。OpenAI以5000亿美元估值领跑行业,其ChatGPT周活跃用户达8亿,年收入预计突破120亿美元,并签下近1万亿美元的算力采购协议。
蚂蚁集团同步推进的深度思考大模型Ring-1T已进入关键阶段,其preview版于9月30日开源。这款万亿参数模型将聚焦复杂逻辑推理能力,与Ling-1T形成技术互补。随着两大模型体系的完善,蚂蚁百灵团队正在构建覆盖从快速响应到深度思考的全场景AI能力。
行业观察人士指出,当前AI发展呈现明显分化趋势。英伟达CEO黄仁勋透露,过去六个月AI计算需求激增,新一代Blackwell架构芯片需求"异常高涨"。这种技术需求与资本流向的双重驱动,正在重塑全球科技产业格局。而蚂蚁集团选择的技术路径,为资源受限环境下的AI发展提供了新的可能性。