ITBear旗下自媒体矩阵:

AI新突破:阿里通义千问开源引领潮流,蚂蚁HOP框架探索大模型可靠应用

   时间:2025-07-28 06:02:00 来源:东方网编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在AI大模型竞赛愈发激烈的背景下,业界的焦点已不再局限于单纯的技术能力较量,而是深入到两个更为核心的挑战:如何不断打破性能极限,以及怎样解决“幻觉”问题,确保AI能切实成为值得信赖的生产工具。在近期举办的2025世界人工智能大会上,阿里巴巴与蚂蚁集团针对这两个关键问题,给出了他们的创新解决方案。

在阿里云主导的“开源·开放”论坛现场,阿里巴巴再次彰显了其在开源领域的先锋地位。一周之内,通义千问系列连续推出了三款重量级模型,迅速在全球范围内引起轰动,并在多个权威榜单上占据领先地位。这些模型涵盖了基础模型、编程模型和推理模型等关键领域,其中,千问3最新版基础模型被ArtificialAnalysis誉为“全球顶尖的非思考基础模型”;其推理模型与业界顶尖的闭源模型比肩,荣获全球开源推理模型冠军;而AI编程模型Qwen3-Coder,凭借在代码生成及Agent调用能力上的突破,超越了GPT4.1、Claude4等闭源巨头,被誉为“全球最佳编程模型”,并在HuggingFace这一全球最大开源社区的总榜上独占鳌头。

阿里云副总裁叶杰平透露,通义千问已实现全尺寸、全模态的全面开源,此举打破了开源与闭源模型之间的技术隔阂。在全球范围内,这一系列开源行动引发了热烈反响,据海外模型平台OpenRouter数据显示,千问API的调用量在短短三天内就突破了1000亿Tokens,热度甚至超过了GPT、Claude等模型。截至目前,通义千问家族的全球下载量已超4亿,稳坐全球开源模型家族的头把交椅。

与此同时,在另一场专注于专业生产力的论坛上,蚂蚁集团旗下蚂蚁密算宣布开源了一项名为“高阶程序(HOP)”的大模型可信应用技术框架,为解决大模型在金融、医疗等严肃领域应用中的“幻觉”问题提供了新路径。浙江大学教授陈纯在论坛上强调,幻觉是智力发展的必然产物,关键在于构建一个能够容忍错误的工程化保障体系。

蚂蚁集团副总裁韦韬对此表示赞同,他以人类工程为例指出,尽管个体容易犯错,但我们仍能通过可靠的工程体系完成如登月等复杂任务。他认为,大模型的可靠应用不应依赖于模型本身的完美无瑕,而应通过智能体系与工程体系的结合来确保。HOP框架正是基于这一理念设计,它借鉴了人类工程管理中的标准作业程序和检查清单等机制,通过将业务逻辑程序化、融入场景知识图谱,并在整个流程中设置核验机制,从而将大模型可能产生的不确定“智力”输出,转化为可信、可控的专业生产力。

以金融联合风控为例,在应用HOP框架后,原本繁琐且依赖人工的风控建模流程被大幅简化,实现了风控全链路的智能化与自动化,不仅确保了高精度,还显著提升了效率和可靠性。韦韬表示:“解决大模型可靠性的关键,不在于模型本身,而在于工程化与智能化的融合。我们开源HOP,旨在与行业伙伴携手,将大模型从辅助工具转变为规模化的专业生产力,并推动新一代杀手级应用的诞生。”

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version