滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

五校联合研究：AI离“火眼金睛”看懂学生数学错误还有多远？

时间：2026-04-08 06:13:39 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

数学作业本上密密麻麻的涂改痕迹，既是学生思考的印记，也是教师诊断学习障碍的关键线索。当人工智能试图破解这些手写密码时，却遭遇了意想不到的认知鸿沟。由五所顶尖科研机构联合开展的研究表明，即便是最先进的AI系统，在理解学生数学错误根源方面仍与人类教师存在显著差距。

研究团队构建的ScratchMath评估平台，犹如为AI量身定制的"教学能力考场"。这个包含1720份真实作业的数据库，完整记录了从一年级到九年级学生的解题轨迹，覆盖数字运算、几何测量、函数方程等五大数学领域。每份作业都经过五位资深数学教师的双重审核，确保错误分类的准确性达到90%以上。这种严谨的数据处理方式，为AI训练提供了可靠的基准参照。

视觉识别成为AI面临的首道屏障。实验数据显示，36%的错误源于符号误读——学生潦草的"1"可能被识别为字母"l"，倾斜的分数线变成减号，甚至整个计算过程因涂改而面目全非。更棘手的是格式理解难题，学生随意添加的箭头、圈画和注释，在AI眼中犹如天书。某商业模型在处理小数除法作业时，竟将学生正确的0.11误判为8.75，根源在于无法追踪计算过程中的小数点移动逻辑。

错误分类任务暴露出更深层的认知局限。研究定义的七大错误类型中，AI对程序性错误和抄写错误的识别准确率较高，但在处理逻辑推理错误时表现堪忧。以方程求解为例，当学生混淆分子分母时，AI常能指出计算错误，却难以判断这是源于对"平均值"概念的误解。这种"知其然不知其所以然"的局限，在统计与概率领域尤为突出——尽管该领域错误识别率较高，但涉及假设检验的复杂问题时，AI准确率骤降至31%。

不同教育阶段的差异呈现有趣反差。在错误解释任务中，AI表现随年级升高呈下降趋势，从一年级的73%准确率跌至九年级的67%。这并非因为高年级作业更难，而是AI难以把握复杂逻辑关系。但在错误分类任务中，中学生作业的识别准确率反而比小学生高18个百分点，这得益于高年级学生更规范的解题步骤和标准化符号使用。

商业化模型与开源系统的较量印证了"一分价钱一分货"的道理。某领先商业模型在解释任务中达到71.8%的准确率，而最佳开源模型仅57.3%。这种差距在错误分类任务中扩大至15个百分点，反映出训练数据质量和算力投入的显著影响。值得注意的是，强化推理能力的模型在复杂题目中表现突出，证明逻辑分析能力是破解数学思维的关键。

实际应用场景中，AI展现出独特的辅助价值。在批改30人班级的作业时，AI可快速筛选出70%的明显错误，使教师能专注处理需要深度分析的案例。某在线教育平台试点显示，结合AI初步诊断和教师人工复核的模式，可使作业反馈效率提升40%。但技术局限同样明显：当学生解题步骤跨越多个数学领域时，AI错误诊断率会上升23%。

教育专家指出，AI与教师的协作可能重塑教学模式。智能系统可记录学生长期的错误模式，为个性化教学提供数据支持。例如，某实验班采用AI生成的错题分析报告后，学生在几何证明题上的正确率提升27%。但这种技术赋能必须谨慎平衡——过度依赖算法可能削弱师生互动中的人文关怀，这是教育本质中不可替代的部分。

研究团队深入分析100个典型失败案例发现，AI常陷入"过度诊断"陷阱。面对简单计算错误，某些模型会编造出复杂的逻辑谬误解释；在处理开放性问题时，又表现出明显的"格式依赖症"，将创新解法误判为错误。这些现象揭示，要让AI真正理解人类思维，不仅需要突破技术瓶颈，更需深入探究认知科学的本质规律。

更多>同类资讯

Codex，1个月吃掉150GB流量，写满4T硬盘，疯了吗？

07-01

千问功能重大调整，不再支持用户创建智能体

7月1日，据《读佳》报道，由于产品功能调整，目前千问已不支持创建智能体，平台中已有的拟人化互动类智能体也会在7月中旬前正式下线，下线后，用户将无法继续访问相关智能体配置及历史对话记录，不过可以通过复制、截图等方式保存智能体配置信息及重要对话记录。

07-01

AI助力突破技术壁垒国产KrF光刻胶树脂研发迈出关键一步

07-01

国产算力新突破！同济携手海光打造千卡集群解锁工程智能新未来

07-01

优必选推全尺寸超仿生人形机器人U1系列

在近期举办的全球发布会上，一家科技企业正式推出全尺寸超仿生人形机器人“优世界”U1系列，涵盖半身版U1 Lite、高配全身版U1 Pro及高动态全身版U1 Ultra三款机型，定价区间为11.98万元至99万元。该系列尚未正式发售便已引发市场关注，全渠道订单量突破13361台，成为全球首款具备规模化量产能力的同类产品。

07-01

专访大晓王飞：世界模型构建进化闭环，具身智能落地迈关键一步

07-01

苹果紧急发布安全更新：应对AI黑客威胁，缩短补丁推送时间护安全

【环球网科技综合报道】7月1日消息，据appleinsider和forbes报道称，为应对人工智能技术加速黑客攻击速度的新现实，苹果公司于本周一打破常规，发布了iOS26.5.2、iPadOS 26.5.…

07-01

机构调研聚焦A股硬科技赛道人形机器人与半导体材料成资金新宠

07-01

天空工场创投基金布局广泛：投资至少58家企业，多领域成果显著

07-01

松下转型：押注AI基础设施，投资加码与裁员并举谋发展

07-01

芯联集成2026年三季度调价15%-25%，全球近20家半导体企业7月已跟进涨价

07-01

AI编程工具“重量”升级：Codex流量硬盘双飙升，轻与重如何抉择？

07-01

Anthropic重磅更新：Sonnet 5性能跃升，Claude Science助力科研新突破

07-01

美光CEO：内存供需失衡不全是芯片商之过客户压价致行业投资不足

07-01

00后陈博远：以通用世界基座模型，引领AI走向物理世界新征程

07-01

点击查看更多 +

全站最新

阿维塔获L3自动驾驶测试牌照多场景道路实测正有序推进

中国汽车产业破局：告别“互黑内卷” 共赴技术品质竞争新征程

出境游旺季语言成难题？讯飞AI眼镜轻装上阵，多语种翻译助力跨境出行沟通无阻

科大讯飞研究院2027届飞星计划启航邀你共赴AI未来新征程

Coffee AI Sound殿堂声音响系统夺冠，彰显中国品牌智能声学技术新高度

法拉利首款纯电Luce亚洲首秀引热议：88台配额锁定订金40万起试驾待明年

热门内容

本栏最新

岚图泰山X8纯电版7月交付，配置拉满，30万级SUV市场激战将启

iCAR V27首轮大规模OTA升级来袭智能驾驶等140余项功能焕新升级

iCAR V27首轮大规模OTA升级来袭智能驾驶安全座舱全面焕新升级

缤果PRO上市月余车主反馈：好看好开又实用，城市代步新选择

织密算力网络郑州打造全国算力“数纽”赋能数字中国建设

AI产业下半场：技术创新与产业落地融合下的五大趋势与机遇洞察

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.