在第二届CCF中国数据大会上,蚂蚁数科宣布了一项重要举措:开源旗下数据智能体关键技术Agentar SQL的全套论文、代码、模型及使用指南。这一技术旨在让非专业人员借助日常语言就能进行商业数据查询与分析,为企业数智化构建起更精准可靠的智能数据分析基础。
蚂蚁数科此次首期开源的是实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供了开箱即用的数据查询方案,极大地提升了文本与数据库查询之间的交互效率。不仅如此,蚂蚁数科还规划在2026年陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互等技术框架,这些框架将覆盖从意图理解、业务理解到数据理解的全链路数据能力。
该技术支持下的蚂蚁数科数据分析智能体Agentar-Scale-SQL,在今年9月25日登顶了全球最具权威性的自然语言转结构化查询语言(NL2SQL)评测基准BIRD-SQL,超越了Google等众多国内外厂商。目前,该智能体在执行准确率排行榜以及执行效率榜上依旧保持双榜第一,且已持续领跑超过两个月。
BIRD-SQL评测要求AI模型将自然语言查询转换为SQL,并能在真实复杂的大规模生产级数据库中稳定执行。其数据集涵盖了金融、电力、医疗等37个真实行业场景,总量达33GB,包含超过1万条高复杂度查询任务,被视为全球难度最高的NL2SQL测试。
研究机构预测,全球商业智能市场规模在2025年将达到474.8亿,中国商业智能与分析软件市场规模在2025年将达12亿,预计到2028年,中国商业智能软件市场规模会增长至17.9亿美元,未来5年市场年复合增长率(CAGR)为12.7%,这使其成为未来构建企业智能技术的重要且必要的投资领域。
当前,中国企业对商业智能与分析产品的使用深度参差不齐,大部分企业的需求集中在报表、驾驶舱、仪表板、数据大屏等数据可视化和简单分析方面。而在真实生产环境中,如何在保证准确性的前提下提升可用性,是NL2SQL在产业中规模化落地面临的普遍挑战。
蚂蚁数科AI技术负责人章鹏在会上指出,NL2SQL在实际落地过程中面临四大严峻挑战。一是要理解模糊多义的人类口语;二是要注入庞大的行业专业知识;三是要解析复杂的数据库结构与关联;四是要生成准确无误的复杂SQL语句。这些挑战表明,简单的模型“套壳”根本无法满足企业级应用对可靠性与准确性的要求。
以金融领域为例,从业者往往需要结合复杂业务规则和多条件组合进行数据查询,才能有效开展产品数据分析。在业务管理中,非专业数据分析人员提出口语化问题,就需要背后的产品准确理解行业术语和询问意图,再与数据库字段精准匹配,才能得出真实准确的结果。
章鹏强调,BIRD-SQL主要评测SQL的复杂度生成能力(在线扩展OnlineScaling),但要真正实现产业可用的NL2SQL乃至数据智能体技术,必须构建更完整的能力栈。除了在线扩展,还需具备离线扩展(Offline Scaling),即对数据库的深度理解与知识结构化;人机交互(Human Interaction),即智能体识别自身不确定性,主动与用户澄清意图,实现白盒化、可纠错的协作;自我进化(Self Evolution),即通过“记忆”优化、工具(如UDF)创建与复用等“免调优”技术,使智能体能够从错误中学习,持续提升,降低对大量标注数据和专家调优的依赖。
蚂蚁数科计划逐步开源这些更全面的能力模块,如理解数据库的Agentar Profiling-SQL、实现免调优进化的Agentar TuningFree-SQL等。首期在线扩展框架Agentar-Scale-SQL的开源内容已发布在arXiv、GitHub、ModelScope及Hugging Face等平台,并迅速吸引了开发者的关注。













