滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

北大团队突破扩散模型后训练瓶颈，递归似然比优化器实现效率性能双提升

时间：2026-03-10 10:43:54 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能视觉生成领域，扩散模型凭借其卓越的高保真数据生成能力，已成为图像合成、视频生成等跨模态任务的核心技术框架。然而，如何让预训练后的扩散模型高效适配具体应用场景，始终是制约技术落地的关键难题。近期，一项发表于国际顶级学术会议的研究提出创新解决方案，通过设计递归似然比优化器，为扩散模型后训练开辟了兼顾效率与性能的新路径。

当前扩散模型的后训练方法主要依赖强化学习与截断反向传播两类技术路线，但均存在显著缺陷。截断反向传播通过终止部分梯度计算降低内存消耗，却导致梯度估计出现结构性偏差，严重时模型会崩溃并生成纯噪声；强化学习虽能控制内存需求，但梯度估计方差过高，样本效率低下且训练收敛缓慢。实验数据显示，使用完整反向传播训练Stable Diffusion 1.4模型仅需50个时间步就消耗约1TB GPU内存，而现有优化方法难以在训练稳定性与生成质量间取得平衡。

研究团队提出的递归似然比优化器，通过重构扩散链计算图实现无偏且低方差的梯度估计。该技术包含三大核心模块：一阶估计模块在初始时间步直接反向传播奖励模型，充分利用结构信息避免精度损失；半阶优化模块引入长度可变的局部子链，通过随机选择起始位置捕捉多尺度视觉特征；零阶估计模块对剩余时间步采用参数扰动策略，确保无偏性同时降低计算开销。这种半阶梯度估计范式巧妙平衡了计算成本与优化效果。

局部子链长度h作为关键调控参数，直接影响内存消耗与梯度方差的关系。研究团队将h的取值问题转化为带内存约束的方差最小化优化，推导出理论最优解析解。实验表明，在30-40GB主流GPU内存环境下，h=2时既能捕捉扩散链关键尺度信息，又可将整体方差降至饱和区间。当h增至3或4时，单步训练时间呈指数级增长，但奖励分数提升幅度不足5%，验证了该参数选择的工程合理性。

理论分析证实，递归似然比估计器具有无偏性，并给出了方差边界与收敛速率保证。相较于传统方法，该技术既解决了截断反向传播的偏差问题，又克服了强化学习的高方差缺陷，在计算效率与优化性能间实现最优平衡。实验数据显示，在文本到图像生成任务中，基于Stable Diffusion 1.4的实验使ImageReward分数从32.90提升至76.55，较主流方法提升幅度达14%-47%。

在文本到视频生成任务的VBench基准测试中，该技术展现出显著优势。在主体一致性、运动流畅度等6项核心指标上，加权平均分达84.63，超越VideoCrafter、Pika等开源及商业模型。特别在动态程度指标上取得70.69分，较次优方案提升5.6%。研究团队还开发了扩散思维链提示词技术，通过分解原始提示词为多尺度指令，使半阶子链能精准定位生成缺陷的尺度特征，在手部生成等细粒度任务中实现突破性进展。

更多>同类资讯

华为云AI新布局：以行业智能体为核心打造企业级AI创新生态

华为云公布了其在AI领域的新布局：以行业智能体为中心构建AI能力，打造企业级AI创新的“黑土地”，用AI解行业难题。华为云联合伙伴、开发者与行业客户共建“行业AI梦工厂”，计划打造智慧医疗、具身智能、智能制造…

03-20

AI助力宝妈育儿路：超八成看诊前咨询，七成复核医嘱显智慧

03-20

欧洲AI新势力崛起！Mistral Small4发布：推理编程多模态全能突破

03-20

十万级轿车新标杆！吉利星耀7性能油耗双优设计科技全面越级

03-20

营收下滑却甩掉历史包袱：阅文以IP生态与AI突围开启新局

03-20

中东冲突下韩国资金“避险东移”，A股港股受青睐，中国资产安全溢价凸显

03-20

和顺石油跨界布局半导体：5.4亿控股奎芯科技瞄准国产替代新机遇

03-20

华为云CEO周跃峰：公有云赋能智能体，重塑企业AI工程新未来

03-20

雷鸟创新携《数码纪元：Elu传说》亮相库克对话共探空间计算新未来

03-20

商汤大装置携手大晓机器人与广西产研院共筑AI产业生态新蓝图

03-20

复旦大学AI教育新探索：百余门课程助力学生从学习到科研创新

2024年秋季学期起，复旦大学推出“AI大课”，建设了116门AI—BEST系列课程，从专业基础课到专业核心课，再到学科进阶和垂域应用，让文社理工医各个学科门类的师生，都能够和AI有“亲密接触”。复旦大学…

03-20

AI重塑家电业：头部企业领航新标准，二三线品牌深陷同质化泥潭

头部企业用AI定义行业规则，强化生态系统能力，大量二三线品牌则在利润挤压与技术趋同的双重压力下，陷入跟随式进化的困境。海尔推出Seeker套系、AI之眼2.0和无人家务概念的组合，不仅把竞争维度拉到了“主…

03-20

OpenAI整合三大产品推桌面超级应用，应对行业竞争聚焦核心业务

【环球网科技综合报道】3月20日消息，据外媒The Verge报道，OpenAI正开发一款桌面“超级应用”，将ChatGPT、CodexAI编程工具及Atlas浏览器三大核心产品整合一体，旨在解决产品碎片化…

03-20

贝索斯蓝色起源发力：近52000颗太阳能卫星布局太空AI算力新赛道

IT之家 3 月 20 日消息，华尔街日报昨日（3 月 19 日）发布博文，报道称杰夫 · 贝索斯旗下的太空探索企业蓝色起源（BlueOrigin）官宣进军太空 AI 基础设施领域。报道称蓝色起源已于 3…

03-20

黄仁勋呼吁科技领袖：理性看待AI，勿散布恐慌促行业创新发展

来源：环球网【环球网科技综合报道】据彭博社3月20日消息，英伟达首席执行官黄仁勋在公司技术大会的小组讨论中公开表态，呼吁科技行业领袖避免散布人工智能恐慌言论，同时回应了Anthropic与五角大楼的合同谈…

03-20

点击查看更多 +

全站最新

小牛电动群访揭秘：聚焦安全交互，以成熟技术持续迭代两轮车智能体验

南方试验场启航，广汽构建“陆空”双轨验证体系，领跑低空经济新赛道

优步加速自动驾驶布局：合作版图持续扩大，未来前景几何？

蔚来ET9地平线特别版上市，双拼外观+四座头枕音响，租电71万起限量199台

法拉利“逆流而上”：不顾成本增加毅然回归物理按键方向盘

蔚来全新ES8半年交付8万台！高端纯电SUV市场持续领跑成绩亮眼

热门内容

本栏最新

十万级轿车新标杆！吉利星耀7性能油耗双优设计科技全面越级

AI重塑家电业：头部企业领航新标准，二三线品牌深陷同质化泥潭

中泰证券揭秘：OpenClaw如何助力投研人打造高效数字员工体系

飞书发布“龙虾”智能体及aily专业版助力办公与企业系统高效升级

三一工车发力新能源赛道 TAI品牌及2026款新品亮相冲击全球领军地位

华为伙伴大会2026：以共享融合之力，共赴数智跃升新征程

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.