在金融科技浪潮下,AI技术已成为金融机构转型的核心驱动力,智能客服、信贷审批、风险管理等场景的AI应用遍地开花。但现实是,开源大模型在实际应用中暴露出准确性不足、推理效率低下、业务适配性差等问题,多数金融机构陷入 “投入高、见效慢” 的AI落地困境,如何让AI真正服务于业务成为行业共同的难题。
中国银联近期发布的一项AI推理加速成果,为这一困境提供了破局思路。其通过技术创新与场景深度融合,让AI在金融服务中真正发挥实效,为智慧金融的落地树立了可借鉴的范例。如中国银联执行副总裁涂晓军所言:“我们正通过联合产业各方共建‘AI+金融’示范应用,推动技术成果从‘实验室验证’走向‘规模化应用’。”
从客户需求出发,直面AI应用痛点
金融服务的核心是客户,而客户反馈是优化服务的重要依据。中国银联作为支付领域的核心企业,每年处理的客户服务总量达千万级,这些来自客服对话、服务工单的海量信息,蕴藏着提升服务体验的关键线索。
但对这些信息的深度挖掘却面临两大阻碍:一是银联业务覆盖广泛,产品与服务种类繁多,不同业务场景的规则差异显著,使得用户反馈的问题难以精准分类;二是用户反馈内容往往冗长繁杂,信息无序且多为口语化表达,从中提炼有效信息并分析根因的难度极大。
为提升效率,银联尝试引入AI技术,将问题标签化后,对历史客服对话进行切片处理,最后送入大语言模型中进行推理分析。然而,初期尝试并不理想:单次通话或服务的分析需耗时15分钟,远超业务可接受范围;6000余个标签的复杂层级结构,更导致分类准确率不足10%,这样的结果显然无法应用于实际生产。
技术迭代升级,实现从 “不可用” 到 “可用”
面对技术瓶颈,银联继续寻找优化方式。技术团队决定通过对标签体系的深度重构,按业务场景与产品类型拆解标签,构建出层次分明的 “标签树”,并为每个标签制定明确的分类规则;同时引入知识图谱技术,利用其分层特性实现检索增强,将一次性推理拆分为分层会话推理。
这一系列优化让问题分类准确率提升至80% 以上,达到了工程可用的标准。但新的问题随之出现:冗长的标签规则导致推理时间仍无法满足10秒内完成的业务要求,技术与业务的适配仍需进一步突破。
跨界联合创新,UCM 技术成效能加速器
为彻底解决推理效率问题,中国银联依托国家人工智能应用中试基地,与华为组成联合创新小组,针对推理性能展开攻关,双方决定引入华为当时还尚未公开发布的UCM(推理记忆数据管理器)技术,而该项技术最终成为了突破性能瓶颈的关键。
通过UCM ,将标签、规则等KV数据进行全局前缀缓存与自动分级缓存,大量的重复推理转化为高效查询,使标签分类的推理时间从600秒降至10秒内,效率提升50倍以上。同时,借助KV分片卸载与注意力稀疏技术,解决了长序列推理中的显存瓶颈,让千万级客户反馈的高效分析成为可能。
中国银联智能化创新中心副总经理杨燕明表示:“经过一系列技术优化,‘客户之声’解决方案已经可以投入到实际生产中,通过AI大模型对问题的精准分类,不仅可以很好地解决客户问题,也对营销、产品设计等业务开展提供了许多帮助。”
多场景落地见效,树立行业应用标杆
如今,新技术方案的应用已从 “客户之声” 场景拓展至银联多个业务领域:在营销策划场景,单个营销计划的生成时间缩短至10秒内,单台服务器可支持5个以上用户同时操作,为支付交易量的提升注入动力;在办公助手场景,能处理超过17万Tokens的超长会议语音转写,生成高质量纪要,覆盖各类会议场景,显著提升内部运营效率。
从客户服务的效率提升,到业务运营的效能优化,银联的 AI 推理技术突破,不仅解决了自身的业务痛点,更验证了 AI 技术在金融领域规模化应用的可行性。其通过 “业务痛点识别 — 技术方案探索 — 跨界联合攻关 — 多场景落地” 的路径,为金融行业破解 AI 落地困局提供了宝贵经验,也让智慧金融的未来图景更加清晰。