滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

北大创新：诊断驱动训练为多模态AI性能提升开辟新路径

时间：2026-02-28 23:56:53 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能技术快速迭代的当下，多模态大模型已成为推动行业变革的核心力量。这类能够同时处理图像、文本等多元信息的系统，正逐步展现出接近人类认知水平的潜力。然而，现有训练方法普遍存在效率瓶颈——模型在海量数据中"盲目"学习，难以针对特定能力短板进行精准提升，这一困境制约着技术的进一步突破。

北京大学与山东大学联合研究团队提出的"诊断驱动渐进演化"（DPE）框架，为破解这一难题提供了创新方案。该系统借鉴医学诊疗理念，构建了包含能力诊断、数据生成、强化训练的闭环体系。实验数据显示，采用该框架的模型在仅使用1000个种子样本的情况下，经过三轮迭代即可在11项基准测试中实现全面超越，数据效率较传统方法提升15倍以上。

研究团队将多模态能力细分为12个专业维度，涵盖几何图形解析、医学影像识别、统计图表解读等关键领域。诊断系统通过动态抽样检测，能精准定位模型在特定任务中的推理缺陷。例如，当模型在处理包含多坐标轴的复合图表时出现错误，系统可进一步分析是数据定位偏差、趋势判断失误还是单位换算错误，并生成结构化诊断报告。

基于诊断结果的多智能体协作系统构成数据生成的核心引擎。规划智能体负责制定训练策略，图像智能体从专业图库中筛选或合成针对性素材，问题生成器设计梯度化训练任务，验证模块则确保数据质量。这种分工机制使系统能动态调整训练重点——当模型在三维空间推理方面表现薄弱时，系统会自动增加建筑图纸解析、立体几何证明等专项训练样本。

强化学习环节采用的GRPO算法通过群体奖励标准化机制，有效解决了传统强化学习中的梯度消失问题。系统优先选择模型正确率在50%左右的"临界样本"进行训练，这种难度控制策略使模型在数学推理任务中的表现提升显著。实验表明，经过DPE训练的模型在视觉数学基准测试中达到76.2分，较基线模型提高12.3%。

在幻觉抑制等安全指标上，DPE框架展现出独特优势。通过针对性训练，模型在复杂场景下的视觉推理准确率提升至74.13%，较商业化大模型提高6.6个百分点。这种改进源于系统对长尾场景的覆盖能力——动态图像编辑模块可生成包含遮挡、变形、光照变化等特殊情况的训练样本，有效提升模型鲁棒性。

参数效率对比实验揭示了数据质量的关键作用。基于80亿参数的模型经DPE训练后，在综合测试中取得64.39分，不仅超越720亿参数的基线模型，更胜过参数规模达其90倍的GPT-4o。这种"四两拨千斤"的效果，验证了精准训练对模型性能的决定性影响。

消融实验进一步证实各模块的协同价值。移除诊断模块后，模型性能出现显著波动，最终得分下降11.2%；禁用动态图像检索功能则导致OCR任务准确率降低35%。这些数据表明，DPE框架的每个组件都经过精心设计，共同构成完整的训练生态。

目前，研究团队已公开全部技术细节，包括诊断维度划分标准、智能体协作协议及强化学习参数设置。这项突破不仅为多模态训练提供了新范式，其模块化设计更具备跨领域迁移潜力。随着技术持续演进，更精准、更高效的AI训练方法有望推动人工智能向通用智能加速迈进。

03-25

AI智能体竞争升级：Anthropic Claude实现电脑操作加速迈向实用阶段

03-25

全球最大主权财富基金探索AI辅助投资，人类监督仍是关键一环

03-25

特斯拉Semi电动卡车新动向：自动充电系统研发中，未来补能或更便捷

03-25

OpenAI关停Sora视频平台：战略重心转向企业业务，冲刺IPO加速布局

03-25

一起教育科技2025Q4营收双增：AI赋能业务，新会员订阅成亮点

03-25

苹果WWDC26即将启幕：软件与AI深度融合，iOS 27等新系统蓄势待发

03-25

OpenAI关停Sora视频服务聚焦企业级产品，冲刺IPO前调整战略方向

03-25

黄仁勋谈生死观：生活美好不愿死，盼工作中猝然离世无痛苦

03-25

华为打造广州白云智慧枢纽样板：站城融合引领全球城轨数智化新潮流

一体化安全管理：让问题「看得透」，基于多源数据融合，根据换乘交通方式的外部环境特征，动态检测各换乘区域超载/空载异常，结合AI调度引擎自动生成运力调度建议方案，提前调配运营车辆蓄车数量及班次发车时间和频率…

03-25

COMPUTEX 2026将启英特尔CEO陈立武6月2日分享AI时代计算新愿景

03-25

月均安装9500万次的AI工具LiteLLM遭供应链投毒，用户密钥等面临泄露风险

03-25

JEDEC发布新标准：LPDDR5/5X内存高低速模式切换更高效节能

03-25

驭星三号06星成功完成在轨测试柔性机械臂助力未来空间服务新突破

图为驭星三号06星柔性机械臂载荷执行在轨加注对接技术验证。北京航天驭星科技股份有限公司供图本报北京3月24日电(记者刘诗瑶)近日，我国首颗配置柔性机械臂的商用试验卫星及关键技术验证。该卫星在太空中通…

03-25

OpenAI向私募股权承诺17.5%回报借PE之力加速布局企业AI市场

03-25

点击查看更多 +

全站最新

华为打造广州白云智慧枢纽样板：站城融合引领全球城轨数智化新潮流

台股大涨近3%

多款新游首曝，友谊时光(6820.HK)的增长飞轮转起来了

美股三大指数集体收跌，纳指跌0.84%，赛富时跌超6%

小屏也能“大”作为：一加15T性能续航双在线，重塑小屏旗舰新标杆

小米CFO林世伟透露：新一代SU7订单火爆，女性及iPhone用户占比亮眼

热门内容

本栏最新

新一代迈巴赫S级全球首秀：智能升级动力强，重新定义超豪华轿车新标杆

新款梅赛德斯 - 迈巴赫S级全球首秀，豪华科技双升级开启新体验

新款梅赛德斯 - 迈巴赫S级全球首秀，智能奢华升级开启豪华出行新体验

华为助力广汽新篇启幕，启境汽车更名完成，迈向高端智能出行新征程

华为打造广州白云智慧枢纽样板：站城融合新范式，引领全球城轨数智化转型

倍耐力P Zero R与Trofeo RS：跑车原配技术赋能，售后市场超高性能轮胎新选择

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.