在2025年世界人工智能大会论坛上,蚂蚁数科震撼发布了专为金融AI应用设计的金融推理大模型——Agentar-Fin-R1。这款智能中枢被赋予了“可靠、可控、可优化”的特性,旨在满足金融行业对智能化解决方案的迫切需求。
Agentar-Fin-R1基于Qwen3架构精心打造,在金融领域权威评测标准Fineval1.0和FinanceIQ上的表现尤为亮眼。它不仅超越了同尺寸的开源通用大模型DeepSeek-R1,还力压其他金融大模型,展现了其在金融专业性、推理能力和安全合规性方面的卓越实力。
随着金融行业数智化转型步伐的加快,大模型在金融领域的应用日益广泛。然而,面对复杂多变的业务场景,金融机构往往要求模型具备深厚的金融知识、复杂的逻辑推理能力和严格的金融级安全合规标准。这些高标准对现有大模型提出了严峻挑战。
蚂蚁数科CEO赵闻飙在演讲中指出:“通用大模型与产业实际应用之间存在一定的‘知识鸿沟’。为了推动金融与AI的深度融合,构建专业的金融大模型已成为必由之路。未来,金融大模型的应用深度将成为金融机构核心竞争力的关键因素。”
蚂蚁数科通过构建涵盖银行、证券、保险、基金、信托等全金融场景的全面任务数据体系,并结合创新的模型训练算法,成功提升了Agentar-Fin-R1的金融推理能力和可信度。在Fineval1.0和FinanceIQ两大主流金融基准测试中,Agentar-Fin-R1均取得了最高评分,同时保持了较高的通用能力水平。
在数据层面,蚂蚁数科凭借业内最全面、最专业的金融任务分类体系,以及千亿级金融专业数据语料,结合可信数据合成技术和专家标注的金融长思维链(CoT)构造机制,显著增强了模型处理复杂金融任务的能力。这使得Agentar-Fin-R1在“出厂”时就具备了深厚的金融知识和专业素养。
在训练层面,蚂蚁数科创新的加权训练算法提高了大模型对复杂金融任务的学习效率和性能。这不仅降低了后续业务应用中二次微调的数据需求和算力消耗,还有效降低了大模型在企业落地的门槛和成本。Agentar-Fin-R1还能持续更新迭代,吸收最新的金融政策和市场动态信息,并通过配套评测工具进行针对性优化,不断提升模型在真实业务场景中的表现。
为了满足金融机构在多样化场景下的部署需求,Agentar-Fin-R1提供了32B和8B参数两个版本。同时,蚂蚁数科还推出了基于百灵大模型的MOE架构模型,以提供更快的推理速度。还有非推理版本的14B和72B参数大模型可供选择。
为了全面考察大模型在实际金融场景中的部署能力,蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构,共同推出了Finova大模型金融应用评测基准。该基准深度考察了智能体的能力、复杂推理以及安全合规能力。在Finova评测中,Agentar-Fin-R1同样取得了最高评分,甚至超越了更大参数规模的通用模型。目前,Finova已经全面开源,旨在推动整个行业提升大模型在金融领域的应用水平。
作为蚂蚁集团旗下的独立科技子公司,蚂蚁数科致力于运用AI及Web3技术推动产业数智化升级。今年以来,蚂蚁数科加速布局企业级大模型服务,并聚焦金融与新能源两大行业场景。在金融领域,蚂蚁数科此前推出的金融智能体平台Agentar已成为首批通过信通院评测的智能体平台产品,并获得最高评级5级。蚂蚁数科还联合行业合作伙伴推出了超过百个金融智能体解决方案,加速大模型在金融业的规模化应用。
以上海某银行为例,蚂蚁数科助力该行打造的AI手机银行创新性地采用了“对话即服务”模式,用户只需通过自然对话即可获取各类金融服务。这一创新模式显著提升了老年客户的满意度,使该行的月活用户同比增长了25%。截至目前,蚂蚁数科已服务了100%的国有银行和股份制银行、超过60%的地方性商业银行以及数百家金融机构。