在世界人工智能大会(WAIC)的舞台上,蚂蚁数科迈出重要一步,正式推出了专为金融推理设计的商业化大模型。与此同时,该公司还慷慨地开源了一项包含1350道金融难题的评测基准Finova,以及一个拥有百万级数据的DeepFinance训练集,这一举动在金融智能化领域引起了广泛关注。
此举被视为中国产业AI向更高价值领域迈进的关键一步,同时也映射出金融智能化进程中所面临的诸多挑战及其应对策略。尽管全球金融机构对AI的投资持续升温,但AI在金融核心业务中的实际应用却相对有限。根据花旗银行的调研数据,尽管93%的金融机构预期AI将在未来五年内提升利润,预计到2028年能为银行业带来1700亿美元的额外利润,但在实际应用层面,AI的渗透率仍然较低。
蚂蚁数科金融AI产品总经理曹刚在接受访问时指出,在营销、风控及客户经理销售等核心业务领域,AI的应用渗透率远不及其他非核心场景。这主要是由于金融场景的专业性和严苛性要求极高,大模型技术尤其是推理模型的发展尚不成熟,导致在关键业务场景的应用效果存在不确定性。金融业务的复杂性也要求AI系统具备深厚的领域专业知识和高质量数据支持,这进一步增加了应用难度。
除了技术层面的挑战,高昂的成本也是制约AI在金融领域广泛应用的重要因素。大模型的训练、部署和推理成本巨大,对底层算力的要求极高,这使得许多机构在权衡技术投入与商业价值时持谨慎态度。因此,尽管AI技术具有巨大的潜力,但在金融核心业务中的大规模应用仍然面临诸多障碍。
为了应对这些挑战,蚂蚁数科采取了专注金融与能源两大高价值领域的策略,不追求通用大模型的发展,而是致力于通过垂直深度构建自身的竞争优势。此次发布的金融大模型专注于满足金融场景的复杂推理需求,如风控和理财建议等。通过两阶段训练法,结合通用基座和金融场景微调,该模型在专业性方面表现出色。同时,蚂蚁数科还自建了DeepFinance金融思维链数据集,由金融专家进行标注,覆盖了存款、信贷、投资等多个场景和细分任务。
为了确保输出的安全性和合规性,该金融大模型还集成了“蚁天鉴”安全评测层。蚂蚁数科还通过开源数据集和评测基准,推动金融AI行业的共同发展,降低应用门槛。他们聚焦头部银行和保险客户,提供从咨询到产品的全链路服务,旨在成为金融AI落地的基础设施。
蚂蚁数科CTO王维认为,AI应用正在从通用场景试验逐步向核心业务重构推进。金融推理模型在这一过程中扮演着至关重要的角色,是推动业务重构的“中枢齿轮”。他预测,未来金融AI将进入场景攻坚期,智能体将逐渐渗透到营销、风控等核心业务领域,替代基础决策。长期来看,多智能体协作将成为常态,例如“风控智能体+投顾智能体”的组合将自动闭环服务高净值客户。
为了直击行业“数据荒”的痛点,蚂蚁数科同步开源了DeepFinance千亿token训练集。王维指出,当认识到技术的局限性时,反而应该更加关注能力的提升。曹刚也强调,未来的竞争核心在于合规与责任。蚂蚁在Agentar平台内置了“监管围栏”,自动过滤不合规的输出,同时呼吁行业明确AI错误的责任归属问题。