滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

香港科技大学与华为研究院联手：LISA训练法让AI绘图效率大幅提升

时间：2026-07-01 00:28:09 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能图像生成领域，一项突破性研究为现有技术瓶颈提供了创新解决方案。香港科技大学与华为研究院联合团队提出的LISA训练框架，通过重构副网络学习机制，显著提升了AI图像生成系统的训练效率与生成质量。该研究以预印本形式公开后，迅速引发学界与产业界关注。

传统AI图像生成系统采用"双分支范式"，由主网络负责审美判断，副网络负责解析用户提供的视觉条件。但研究团队发现，副网络在训练过程中长期缺乏明确指引，如同新员工未获具体职责说明，导致训练效率低下。以Stable Diffusion等主流模型为例，其副网络需要消耗大量计算资源才能逐步掌握条件解析能力。

LISA框架的核心创新在于构建了"似然分数对齐"机制。研究团队通过数学推导证明，条件生成过程可分解为主网络的无条件审美判断与副网络的条件修正信号叠加。基于此发现，LISA通过计算训练数据条件分数与主网络无条件输出的差值，为副网络生成精准的学习目标。这种内生性目标生成方式，无需依赖任何外部模型或额外标注数据。

实验数据显示，LISA在多个生成任务中展现惊人效率。在姿势控制任务中，采用LISA的ControlNet仅需1万步训练即可达到83.02%的姿势准确率，而传统方法需要3万步才能实现89.82%的准确率。深度图引导任务中，LISA用40%的训练时间便在图像质量、语义匹配和深度精度三个维度全面超越基线模型。这种效率提升在视频生成领域更为显著，时尚视频生成任务的姿势准确率从30.22%跃升至57.00%。

该技术的突破性不仅体现在速度提升。研究证实，经过LISA训练的副网络具备更强的任务解耦能力，支持多条件组合生成。实验表明，同时处理姿势与分割图条件时，LISA模型的场景理解准确率提升18.5%，文本语义匹配度提高5.2%。这种"模块化"特性为复杂场景生成开辟了新路径。

技术实现层面，LISA通过轻量级解码器实现特征对齐。该解码器参数量仅占副网络的0.1%，训练完成后即可丢弃，对推理过程无任何影响。超参数研究显示，在副网络第5层进行特征对齐，并设置0.2的损失权重时，系统达到最佳平衡点。这种设计使得LISA在保持主网络架构不变的前提下，实现训练效率与生成质量的双重优化。

相较于依赖预训练模型的REPA等对齐方法，LISA展现出更强的泛化能力。在Stable Diffusion 3等新型架构上，LISA同样实现显著性能提升，证明其原理不依赖于特定网络结构。这种通用性为不同技术路线的AI生成系统提供了标准化优化方案。

对于开发者而言，LISA提供了近乎零成本的改进方案。实验显示，采用LISA的ControlNet参数量仅增加0.1%，训练时间增幅不足10%，而推理阶段完全无额外开销。这种特性使得现有图像生成工具可快速集成LISA技术，为用户带来更精准的条件控制体验。

该研究已引发多领域应用探索。在医疗影像生成中，LISA有望提升解剖结构控制的精准度；在工业设计领域，其多条件组合能力可支持更复杂的产品渲染需求。随着研究团队持续优化技术细节，LISA框架或将推动AI生成技术进入新的发展阶段。

更多>同类资讯

优必选发布全尺寸超仿生人形机器人U1系列，订单破万开启人机共生新未来

07-01

清华等高校提出OPID框架，让AI从“只看结果”到“善学过程”

07-01

英加两校联手打造AI“算盘”：让机器数数像人类一样精准可靠

07-01

AI生成大提速！UCSD等团队提出JETSPEC方法，破解大模型逐字生成瓶颈

07-01

中昊芯英“须臾®”芯片亮相泰则®2.0智算平台同步升级性能

07-01

强化学习致AI工具调用崩溃？中科院自动化所给出修复新策略

07-01

上海创智学院携手穹彻智能共建联合实验室共育具身智能全栈人才

07-01

复旦大学新突破：机器人学会“自主探索” 适应新环境更高效

07-01

最高近百万的“赛博伴侣”来袭，是科技新宠还是昂贵“玩具”？

07-01

自变量机器人推出X-Tokenizer：重新定义VLA动作离散化新问题

07-01

优必选Cruzr Y1工业人形机器人亮相，旭日芯片助力工业场景能力升级

07-01

OpenAI系统底层优化显成效：AI模型推理成本大幅削减超五成

07-01

AI编程工具“重量级”进化：Codex流量硬盘双飙升，轻与重何去何从？

07-01

邬贺铨院士：2026年工业互联网迈入智能体新阶段，聚焦三大瓶颈与协同发展

06-30

Momenta港股招股引关注，智能驾驶竞争白热化谁能突围？

06-30

点击查看更多 +

全站最新

REDMI K90至尊版来袭！狂暴双芯+超强散热，2999元起开启游戏新体验

雷军谈小米SU7 Ultra纽北表现：立志打造比肩保时捷特斯拉的梦想座驾

织密算力网络郑州打造全国算力“数纽”赋能数字中国建设

鸿蒙智行智界V9旗舰MPV受热捧 6月交付量突破5000台大关

14个月10万辆达成，东风日产以体系力破局新能源市场

现代汽车或效仿丰田：主流车型加速混动转型，纯燃油车渐行渐远

热门内容

本栏最新

织密算力网络郑州打造全国算力“数纽”赋能数字中国建设

AI产业下半场：技术创新与产业落地融合下的五大趋势与机遇洞察

15万级荣威家越07将至，AI座舱与智驾升级，能否成家用SUV新宠？

华为极简全闪数据中心2.0：以数智之力，赋能千行百业数智化跃迁

世优科技赋能教育：数字人、动作捕捉与VR课堂共绘智慧校园新图景

晟兴电话机器人助力资料补全：小步试跑精准优化，让人机协作更高效自然

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.