滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AI学习总“卡壳”？浙大等团队新招：让AI像学生一样精准纠错进步

时间：2026-05-06 20:25:43 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当人工智能模型在专业领域考试中答错题目时，开发者往往陷入数据堆砌的循环——不断投入更多训练样本，却始终无法精准定位问题根源。浙江大学、中国科学院大学与上海人工智能实验室联合提出的"用数据编程"框架（ProDa），为破解这一行业难题提供了创新方案。该研究通过构建可追溯的知识结构体系，首次实现了AI训练过程的闭环调试，相关成果已在预印本平台arXiv公开。

传统AI训练存在显著缺陷：模型在医学、法律等专业领域学习时，若出现错误回答，开发者既无法追溯具体知识漏洞，也无法针对性修复。这种"开环训练"模式导致资源浪费严重，例如在心脏疾病诊断训练中，模型可能因混淆"钠离子通道失活"与"心肌细胞去极化"导致答题错误，但现有方法无法定位具体混淆点。研究团队将软件工程领域的"测试驱动开发"理念引入AI训练，通过建立训练数据与测试题目的共同知识基础，使模型调试从经验主义转向工程化。

核心突破在于构建三层知识结构体系：最底层的原子概念层（L1）包含22.7万个专业术语定义，如"电压门控钠离子通道"的精确释义；中间的知识关系层（L2）记录18.6万条概念间逻辑，如"高钾血症导致膜持续去极化"的因果关系；顶层的推理链层（L3）则串联4.3万条多步骤推理路径，完整呈现从病因到临床表现的医学逻辑。这种自上而下的提取方式确保每个概念都参与至少一条推理链，消除知识孤岛。

训练数据与测试题目采用差异化生成策略：前者从L1和L2层生成选择题、判断题等基础题型，后者从L3层生成需要多步骤推理的综合题。例如在经济学训练中，系统会生成考查"三重检验标准"的推理题，干扰选项则通过颠倒L2关系方向（如将"A促进B"改为"B促进A"）或截断推理链制造。这种设计使模型必须真正理解知识结构才能正确答题，而非简单记忆答案。

调试环节展现工程化优势：当模型答错时，系统自动分析错误类型——若因概念混淆（如分不清"相对论"与"量子力学"适用范围），则生成对比性强化样本；若属推理缺陷（如知道公式却不会解题步骤），则补充带中间步骤的思维链样本。修复样本与原始训练数据的子集混合训练时，系统会刻意避开已覆盖的L2关系，防止"灾难性遗忘"。实验显示，这种精准修复使30亿参数的Qwen-3-4B模型在16学科测试中得分提升11.17个百分点，超过经过人类反馈强化训练的官方版本。

实证研究覆盖物理、医学、经济学等16个学科，基于11.7万份教材文档提取出46万个知识节点。生成的1.6万道测试题与11个国际基准的相关性达0.847，证明其有效性。在光学训练中，模型通过修复"未抵消半波带面积比例"的概念缺口，正确解答了菲涅耳半波带法相关题目；在医学训练中，通过强化"钠离子通道失活"的双重否定逻辑，准确描述了高钾血症的电生理机制。

控制实验揭示数据效率革命：ProDa使用每学科1000条修复样本的效果，超越其他方法使用10000条数据的效果。在法律领域训练中，精准修复使模型对WTO裁定流程的理解准确率提升32.7个百分点，而盲目增加数据仅提升9.3个百分点。这种差异源于ProDa能直接针对模型的知识缺陷生成训练样本，而非依赖数据量的概率覆盖。

研究团队开发的ProDa Studio开源工具包，将知识提取、基准生成、模型训练等环节整合为可视化流程。开发者可在统一界面中完成从原始文档到调试评估的全流程，系统自动记录从语料到评分结果的完整溯源链。该工具已支持Qwen、Llama等主流模型家族，在GitHub和HuggingFace平台公开代码与数据集。

这项突破为专业领域AI训练开辟新路径。通过建立可解释的知识结构，开发者首次获得"手术刀"般的调试能力——既能精准修复模型的知识漏洞，又能避免通用能力衰退。实验显示，经过两轮调试的模型在MMLU通用知识测试中得分提升0.27个百分点，证明该方法在提升专业能力的同时，反而强化了基础认知。这种训练范式的转变，或将推动医疗诊断、法律咨询等高风险AI应用进入精准迭代时代。

更多>同类资讯

旧金山炉边对话：Stripe科里森与OpenAI奥特曼共探AI未来新图景

05-06

浙江晚高峰新“交警”：AI交管机器人依托“九天”模型高效疏导交通

05-06

GMI Cloud蒋剑彪：AI产业新趋势，系统能力成制胜关键

05-06

上海具身智能峰会聚焦“大脑”突破产业集群共探机器人发展新路径

05-06

康宁携手英伟达强化美国AI基建光纤产量增超50% 盘前股价飙升

05-06

英伟达携手康宁强化AI基建，康宁盘前飙升超15%将新建三厂

05-06

中科院团队打造手机AI“小能手”：2.3亿参数模型力压70亿参数大模型

05-06

陶哲轩用Claude Code高效改论文：15分钟搞定审稿意见，AI成科研好帮手

05-06

AMD苏姿丰：AI浪潮下CPU地位攀升，公司开启高增长新篇章

05-06

映泰2026台北电脑展将展AMD下一代主板或为Zen 6架构处理器铺路

05-06

AI浪潮下存储行业“大变局”：从被动承载到主动赋能的进化之路

05-06

德国工业老将吉洋创业：AI赋能硬件开发，让创新门槛大幅降低

05-06

中国移动加速AI布局：超8万数智员工上岗，移动版智能助理即将登场

05-06

云南电网携手华为SPN：数智赋能，打造电力通信新“高速路”

05-06

Anthropic一发布Multica就开源，这个4人团队想抢占AI协作层

05-06

点击查看更多 +

全站最新

CLA反哺全球显成效奔驰深耕中国加速电动化与智能化转型

小米首款增程全尺寸SUV“SKYNOMAD”谍照流出，家庭市场新选择下半年发布

智屏“三位一体”生态构建大屏营销新范式，助力品牌破圈增长有新招

家居消费新选择：上海实体展厅如何成为“信任”与“品质”的双重保障

云南电网携手华为SPN：数智赋能，打造电力通信新“高速路”

上海非织造布展：科学布局展位空间精准视觉营销助力品牌破圈

热门内容

本栏最新

云南电网携手华为SPN：数智赋能，打造电力通信新“高速路”

英特尔高层大变动：前高通高管执掌新事业部，CTO人选同步落定

魔形智能获数亿元Pre-A轮融资加速AGI产业高性能Token产品布局

2026北京车展：吉利银河之光第2代首发智擎混动技术引领绿色出行

AI大厂激战正酣，普通人如何破局？挖掘自身数据宝藏打造专属智能体

吉利中国星i-HEV智擎混动双车上市以AI油混开启节能出行新体验

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.