ITBear旗下自媒体矩阵:

阿里巴巴云计算新突破:D-CORE框架助力AI推理模型破解复杂任务难题

   时间:2026-02-07 22:01:56 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在人工智能领域,处理复杂任务的能力始终是衡量模型智能水平的关键指标。近期,阿里巴巴云计算团队提出了一项突破性训练框架D-CORE,通过创新的任务分解机制和思维训练方法,成功破解了当前大语言模型在复杂工具使用中普遍存在的"无效思考"困境。这项研究成果已在国际学术平台发布,为AI系统解决现实世界复杂问题提供了全新思路。

传统大语言模型在处理单一任务时表现优异,例如查询天气或发送邮件等标准化操作。但当面对需要调用多个工具、协调多轮对话的复合型任务时,模型常陷入"思维空转"状态——产生大量冗余思考却无法形成有效执行方案。研究团队通过实验发现,这类模型在复杂场景下的思考长度与正确率完全脱钩,即便进行数千次反思仍无法提升任务完成质量,这种现象被形象地称为"懒惰思考"。

D-CORE框架的突破性在于构建了双阶段训练体系。第一阶段采用"自我蒸馏"技术,通过向模型展示标准化的任务分解范例,使其掌握将复杂指令拆解为可执行子步骤的能力。例如面对"整理季度文档并归档"的指令,模型能自动生成"定位文件→创建文件夹→复制文件"的清晰步骤链。第二阶段引入"多样性感知强化学习",通过熵优势机制鼓励模型在保持结构化思维的同时,使用更具信息量的词汇进行深度思考,避免陷入机械化的操作模式。

在基准测试中,经过D-CORE训练的模型展现出惊人性能。80亿参数规模的模型在复杂工具使用测试中取得77.7%的准确率,较同类最优模型提升5.7个百分点;140亿参数版本更以79.3%的准确率超越参数量达700亿的巨型模型,这种"以小博大"的表现颠覆了传统认知。特别是在多轮对话场景中,该模型将基础版本的正确率从33%提升至63.8%,相当于在数学考试中从及格线跃升至优秀水平。

技术分析显示,D-CORE框架成功重塑了模型的思维模式。在文件管理测试中,基础模型产生1616词冗余思考仍给出错误答案,而D-CORE模型仅用799词就精准完成任务。这种效率提升源于框架对任务依赖关系的精准识别——模型能自动判断哪些子任务需要顺序执行,哪些可以并行处理,哪些工具调用实为冗余操作。

该技术的实用价值已在多个领域得到验证。在智能客服场景中,D-CORE模型能同时处理改签机票、申请退款、查询积分等关联请求;在企业办公场景,可自动协调CRM查询、库存检查、财务开票等跨系统流程;个人助手应用中,能将"安排出差"的模糊指令分解为航班查询、酒店预订、客户会议等20余个具体操作步骤。测试数据显示,模型在真实交互场景中的准确率提升幅度达到17%-18.6%。

研究团队通过消融实验证实,框架各组件存在显著协同效应。单独使用自我蒸馏虽能提升任务分解能力,但会牺牲反思深度;仅采用多样性强化学习可增强思考灵活性,却无法解决根本性的思维惰性。两者的有机结合,使模型既保持结构化思维,又具备动态调整策略的智能特征。

这项突破为AI商业化应用开辟了新路径。相比依赖参数规模扩张的传统路线,D-CORE框架通过优化思维模式实现性能跃升,显著降低了算力需求。目前,阿里巴巴团队正推进该技术与多智能体系统、多模态交互等前沿领域的融合研究,探索让AI系统具备更复杂的规划推理能力和长期任务处理能力。

对于普通用户而言,这项技术进步意味着人机协作将进入新阶段。当AI助手学会像人类项目经理般拆解任务、协调资源、应对变化,我们与数字世界的交互将变得更加自然高效。从预订复杂行程到管理企业流程,从处理客户投诉到规划个人事务,智能系统正在突破"工具"的局限,向真正的"数字伙伴"演进。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version