在2025年世界人工智能大会的一个焦点论坛上,蚂蚁密算宣布了一项重大举措:开源其高阶程序(High-Order Program,简称HOP)大模型可信应用技术框架。此举旨在探索智能与工程深度融合的新路径,以解决大模型在专业应用领域的可靠性挑战,并推动其在多个行业中的广泛应用。
论坛上,浙江大学教授、区块链与数据安全全国重点实验室主任陈纯指出,大模型在专业化应用中面临的首要问题是可靠性。尽管当前技术的顶尖水平已接近90%,但在医疗、工业、金融等专业场景中,这一可靠性水平仍显不足。陈纯强调,将可靠性问题简单归结为“幻觉”并不全面,因为幻觉是智力发展的必然产物。关键在于,我们不应试图消除所有“智力特征”,而应通过构建工程化保障框架来提升可靠性。
蚂蚁集团副总裁、蚂蚁密算董事长韦韬分享了对于这一挑战的看法。他认为,解决大模型在专业化应用中的可靠性问题,不应仅仅依赖于大模型本身的完美无缺,而应通过智能体系与工程体系的结合来实现。他比喻说,就像个体容易犯错一样,但人类通过长期的工程体系进步,成功构建了可靠的系统,完成了诸如太空探索等艰巨任务。韦韬提出,通过创新的程序表达、场景知识嵌入和闭环核验反馈机制,可以将大模型的不确定性转化为可信的专业生产力。
蚂蚁密算正在探索的高阶程序大模型可信应用技术框架,包含业务逻辑的程序化表达、场景知识图谱和受控工具链等核心组件。该框架在全流程中嵌入核验机制,确保关键执行结果的及时、有效核验和处理。通过借鉴人类在工程管理体系中的成功经验,如标准作业程序(SOP)和检查清单,该框架构建了一个可复用、可验证、可扩展和可派生的机制,即使大模型在应用过程中出现幻觉问题,也能保证其达到专业领域所需的精确性和可靠性。
高阶程序(HOP)融合了编程语言的精确性和可扩展性,以及自然语言的知识语义与语境适配能力。它承载了专业领域的关键知识和实践,通过任务细化拆解与核验,确保大模型在专业应用中的可靠性。通过知识概念匹配,实现从专业知识到场景应用的派生适配,使得大模型能够在原本需要人工处理的众多场景中实现高可靠、高自动化应用。目前,该技术框架已在金融风控、网络入侵检测、医疗重复计费等多个行业场景中初步应用,显著提升了可靠性和时效性。
以金融联合风控为例,传统风控体系高度依赖人工干预,导致流程冗长、响应缓慢,并易受人员主观因素影响。而应用HOP技术框架后,复杂的SOP被转化为可执行的流程和代码,实现了风控全链路的智能化编排与自动化执行。这不仅缩短了建模周期,还显著减少了重复性数据处理和流程执行等基础工作,降低了处理成本,并缓解了专业人才紧缺的问题。
韦韬表示,高阶程序与大模型之间存在强烈的互补性,能够将大模型这样的通用智力引擎可靠地应用于众多专业场景。他强调,解决大模型可靠性的关键在于工程化与智能化的融合。通过开源高阶程序HOP,蚂蚁密算希望与行业伙伴共同努力,将大模型从人类助手转变为规模化专业生产力,并期待在解决可靠性问题后,涌现出更多具有颠覆性的行业应用。