滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

AI“看图说话”背后：链式推理是助力还是干扰？多模态真相待解

时间：2026-06-30 04:08:11 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当人类面对一张布满玩具车的图片时，只需扫视一眼就能准确说出数量。但当顶尖人工智能被要求"先思考再回答"时，这个看似简单的任务却让AI集体陷入混乱。这项由中国科研团队完成的大规模实验，揭示了多模态大模型在视觉推理领域存在的根本性缺陷。

实验覆盖22个主流AI模型，通过12类任务测试发现，被寄予厚望的"链式推理"技术（Chain-of-Thought）在数学题等逻辑任务中表现优异，却使视觉定位准确率下降4.6%，物体计数错误率增加4.8%。研究人员将这种现象归因于AI的"注意力偏移"——随着推理文字的增加，模型逐渐将关注点从原始图片转向自身生成的中间步骤，如同画家作画时突然专注于自己的笔触而忘记参照原图。

实验设计者通过拆解几何推理任务发现，AI在视觉信息提取阶段的得分比文字计算阶段低20个百分点。这种"轻视觉重语言"的倾向在长篇推理中尤为明显：模型对图片的关注度随着推理进程呈指数级下降，最终完全依赖文字逻辑而脱离视觉依据。当研究人员故意遮挡图片关键信息时，所有模型虽能产生困惑反思，却仍坚持给出错误答案，暴露出浅层视觉理解的本质缺陷。

对比开源模型与商业模型的表现差异更为显著。以数学题为训练素材的开源模型在空间推理任务中表现退化，而谷歌Gemini-2.0等商业模型通过多样化训练数据，在算法推理任务中取得24.7%的精度提升。这种差异印证了研究团队的判断：当前AI的视觉推理能力高度依赖训练数据的领域分布，数学专项训练反而会削弱跨模态理解能力。

实验中出现的反常现象引发深度思考。在视觉定位任务中，规模较小的模型因强制链式推理导致性能下降，类似基础薄弱的学生被要求展示解题过程反而暴露知识漏洞。更值得警惕的是，所有测试模型在图片信息缺失时均无法主动终止推理，这种"明知不可为而为之"的机械性，暴露出AI缺乏真正的认知判断能力。

针对这些缺陷，研究团队提出两条改进路径：一是构建视觉回溯机制，使模型在推理过程中能主动检查图片关键区域；二是开发视觉工具库，让AI在需要时调用图像识别等专用工具。实验显示，配备视觉放大功能的模型在信息缺失时能拒绝作答，调用坐标定位工具的模型则成功解决了复杂棋盘问题。但研究者同时指出，现有模型仍倾向于使用计算器等文字工具，视觉工具使用意识亟待培养。

该研究采用独特的"探针实验"方法，通过分离视觉与文字子任务，精确测量AI在不同认知阶段的性能表现。实验数据表明，视觉信息提取能力与最终解题准确率的相关性高达0.82，远超文字计算能力的0.63。这种量化分析为改进多模态模型提供了关键指标，相关论文已通过arXiv平台公开，编号2606.22565。

更多>同类资讯

零代码也能玩转编程？AI工具三分钟生成实用天气查询网页

06-30

抖音反诈工具验证助手再升级语音图片齐助力老人轻松鉴风险

06-30

Meta为防“蒸馏”风险限制AI工程师使用Claude和Codex模型

06-30

马斯克55岁生日：家庭温情与商业雄心交织，蛋糕藏理想许愿引热议

06-30

AI模型迭代大战：OpenAI与Anthropic月更狂飙谷歌陷入断档困境

06-30

谷歌翻译新动作：借鉴多邻国机制推出“连续打卡天数”桌面小组件

06-30

联想携手发布全球首款AI可信一体机四重技术筑牢智能体安全防线

06-30

国产显卡砺算LX 7G100初体验：性能有亮点，驱动仍需加把劲

06-30

字节阿里相继“退游”：是战略收缩，还是承认游戏非主航道之选？

06-30

茶咖品牌与乙女游戏联动：借势破圈，精准触达女性消费新势力

06-30

马斯克Grok 4.5开启内测性能比肩Claude Opus，xAI今年每月推新模型加速AI竞争

06-30

豆包灰度测试社交新功能打通飞书账号体系同步上线专业版服务

06-30

谷歌算力吃紧限制Meta使用Gemini，AI产业算力瓶颈难题待解

06-30

联想服务器业务增长预期上调，明年两大客户交付规模或直逼2000亿

06-30

Kimi B端负责人黄震昕：AI行业存泡沫但供需质变下基本面稳健

06-30

点击查看更多 +

全站最新

TMC2026聚焦电驱油低粘化，陶氏携新技术与行业共探动力系统新未来

玛莎拉蒂新动向：手动挡或重现，V8引擎重启在评估，燃油混动双布局

比亚迪元UP焕新升级：续航达505Km，能否成为年轻人出行代步新宠？

电车电池健康度自查攻略：3种零成本方法，在家1分钟搞定无需跑门店

DS推出新款DS N7 E-Tense纯电SUV 多种动力续航可选充电高效

比亚迪大汉实车亮相！大型车身搭配双动力，纯电续航有望突破千公里

热门内容

本栏最新

2027款星海V9获国际名流青睐，以实力推动20万级MPV豪华体验新跨越

豆包内测社交功能引热议官方回应：与飞书协同办公无社交布局计划

全球首座AI艺术馆Dataland启幕：以生物传感技术开启雨林沉浸对话新体验

豆包“进化”：从聊天助手到代码高手，能否在硬核赛场证明自己？

纽北赛道见证奇迹！民间车主驾小米SU7 Ultra破圈速央视力挺国产车实力

6月新车大放送！从家用到豪华，这6款高性价比车型不容错过

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.