滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

华东师大新研究：AI学“错题”竟比刷“正确题”更有效？

时间：2026-06-30 04:07:29 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

华东师范大学与上海创新研究院联合开展的一项研究，为人工智能推理训练开辟了新路径。这项以预印本形式发布于学术平台的研究，通过分析大型语言模型的学习特性，提出了一套名为ReNIO的权重分配机制，颠覆了传统训练中“以正确示范为主”的思维定式。实验表明，让模型重点学习自身错误推理路径，反而能显著提升其解决复杂数学问题的能力。

研究团队以数学推理任务为切入点，对比了两种截然不同的训练策略：一组模型仅接触自身正确解答的题目，另一组则专注于分析错误案例。在三个国际数学竞赛题库的测试中，错误导向训练的模型平均得分高出2.5个百分点以上。这种差异源于模型推理风格的转变——错误训练组生成的解答更长，且频繁使用“等一下”“再检查”等自我纠错词汇，展现出更强的探索性和谨慎性。

传统强化学习依赖完整解答后的结果反馈，而研究采用的在线蒸馏技术允许在推理中途介入。团队发现，模型出错通常源于特定节点的关键偏离，而非全程错误。例如在计算“9×2”时误写为“13×2”，这个错误选择会导致后续推理全面偏离正确轨道。关键在于，教师模型与学生模型在错误节点的概率预测存在显著差异，这种“学生-教师对数比”可作为实时纠错信号，无需等待最终答案即可识别高价值错误样本。

ReNIO机制通过三步实现精准纠错：首先计算每步推理中学生模型相对教师模型的偏离程度；其次筛选出对数比超过阈值的关键节点，并裁剪极端值以保持训练稳定；最后将所有关键节点的偏离值汇总为样本权重，指导训练资源分配。实验数据显示，该方法使1.7B参数模型在AIME24竞赛题上的准确率提升8.9%，7B参数模型的AIME25得分提高10%，且在代码生成任务中同样有效。

该技术的成本优势尤为突出。在短前缀训练模式下，模型仅需生成1024个词即可开始学习，其效果优于完整4096词推理的强化学习方法，且训练速度提升近6倍。进一步分析显示，ReNIO自动筛选的错误样本具有明确特征：教师模型对这些路径的下一步判断高度确定，确保纠错信号的可靠性。消融实验证实，对数比裁剪、关键节点筛选和批次归一化三个设计缺一不可，任意组件的缺失都会导致性能下降。

具体案例生动展现了ReNIO的纠错能力。在求解非负整数三元组问题时，传统在线蒸馏模型计算出603种解法，但未发现重复计算；而ReNIO训练的模型在推理中途主动质疑：“每个集合都包含(100,100,100)，需减去重复计算的2次”，最终得出正确答案601。这种自我检验机制，正是复杂问题求解中至关重要的能力。

研究团队指出，当前验证主要基于中小规模模型，未来需探索其在更大参数模型中的应用潜力。这项发现不仅为AI训练提供了新范式，其核心逻辑——通过分析错误定位认知盲区——亦与人类学习规律不谋而合。对技术细节感兴趣的读者，可通过arXiv平台检索论文编号2606.23104获取完整研究内容。

更多>同类资讯

上海AI实验室推EBench评测体系：机器人能力短板一测便知

06-30

滑铁卢大学与ServiceNow携手：用人类判断教AI守护隐私边界

06-30

万卡时代破局：中国算力以系统优化突围，重构下一代算力底座

06-30

欧盟新规落地：强化AI监管，严令禁止生成色情私密内容并推迟部分合规时限

06-30

具身智能照进现实：大晓机器狗在上海西岸开启全天候智能守护新篇

06-30

惠普携手OpenAI深化合作：全球业务全面融入Frontier平台促转型升级

06-30

中国移动再布局：设立Token办公室，引领通信行业迈向移动智能新时代

06-30

全球汽车零部件巨头博世换帅：哈通卸任，菲舍尔接棒谋新局

06-30

酷态科外骨骼机器人招募体验者啦！50个名额，众测后设备免费留

06-30

中国移动成立Token办公室运营商探索AI时代“Token经营”新路径

06-30

2026郑州PLC控制柜新趋势：携君电气技术深耕与多元实践探索

针对郑州地区企业普遍存在的设备改造需求，该公司能够提供从方案设计、图纸深化到设备成套、现场实施的全程服务。郑州携君电气设备有限公司凭借在自动化控制领域的专业积累和对本地行业痛点的理解，在消防控制柜、变频器配套…

06-30

MWC上海2026：拓恳科技陈明谈6G如何赋能异构机器人协同与行业落地

记者：拓恳自研 HiveMind 异构机器人群智操作系统被称为机器人“通用翻译中枢”，这套系统从底层架构上做了哪些独创设计，打破不同厂商机器人的协议、数据、控制壁垒，实现跨品牌即插即用协同？陈明：未来3…

06-30

华为引领体验经营新趋势：核心网创新助力运营商开启价值增长新篇章

武云骥告诉C114，UE Logo在1.0时代主要实现Logo动态变更，从显示运营商名称变为显示VIP或特定套餐标识;目前正在验证的2.0版本则更进一步，用户下拉Logo即可查看当前可获得速率、体验MOS值…

06-30

iPhone 18 Pro芯片架构曝光：WMCM封装革新，或9月8日携折叠屏登场

早在去年就有报告认为，苹果将在 iPhone 18 系列的 A20 芯片上首次采用台积电 2nm（N2）工艺，并引入一种全新的WMCM（晶圆级多芯片模块）封装技术。在 iPhone 17 Pro 及之前的…

06-30

图灵奖得主Joseph Sifakis出任曹操出行首席科学顾问

06-29

点击查看更多 +

全站最新

TMC2026聚焦电驱油低粘化，陶氏携新技术与行业共探动力系统新未来

玛莎拉蒂新动向：手动挡或重现，V8引擎重启在评估，燃油混动双布局

比亚迪元UP焕新升级：续航达505Km，能否成为年轻人出行代步新宠？

电车电池健康度自查攻略：3种零成本方法，在家1分钟搞定无需跑门店

DS推出新款DS N7 E-Tense纯电SUV 多种动力续航可选充电高效

比亚迪大汉实车亮相！大型车身搭配双动力，纯电续航有望突破千公里

热门内容

本栏最新

晟兴电话机器人助力资料补全：小步试跑精准优化，让人机协作更高效

晟兴电话机器人通知确认：把握语气要点，做好场景规划与细节优化

股东会亮出“价值底牌”，长城汽车引领行业跳出“销量陷阱”

华为杨扬：借AI焕新产品服务携手各方推动Token经营价值提升

东风奕派M8正式开启预售！大六座布局+华为科技加持，19.98万起售

东风奕派M8开启预售：大六座SUV新选择，纯电增程双版本来袭

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.