滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

字节跳动等团队新突破：DanceOPD框架让AI图像生成“一脑多能”

时间：2026-07-01 00:29:38 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

字节跳动旗下研究团队联合新加坡国立大学、马里兰大学及香港科技大学，提出一种名为DanceOPD的生成能力蒸馏框架，旨在解决AI图像生成模型同时掌握多种能力时的互相干扰问题。相关研究以预印本形式发布于arXiv平台，论文编号为arXiv:2606.27377，为多任务AI模型训练提供了全新思路。

传统AI图像生成模型在面对文字生图、局部编辑和全局风格转换等多样化需求时，往往陷入能力冲突的困境。例如，文字生图需要天马行空的创造力，局部编辑要求精准的像素级控制，而全局风格转换则需平衡整体氛围与细节保留。当这些任务被强行混合训练时，模型性能会因目标冲突而显著下降，如同要求厨师同时创作原创料理、复刻经典菜品并改造现有菜品，最终导致三项技能均表现平庸。

研究团队将多能力训练问题转化为"速度场协调"问题。他们将模型去噪过程视为从噪点图像到清晰图像的路径规划，每种能力对应不同的"导航策略"：文字生图是自由探索，局部编辑是精准避障，风格转换是定向迁移。DanceOPD的核心创新在于让模型动态学习不同场景下的最优路径，而非简单混合多种策略。

该框架通过三个关键设计实现能力解耦：首先采用"硬路由"机制，确保每张训练样本仅向对应领域的专家模型取经，避免不同目标间的信号干扰；其次实施"在线取经"策略，在学生模型实际生成的路径上选择取经位置，消除分布偏移问题；最后限定"单次语义侧查询"，仅在去噪路径末端的高信息密度区域取经，提升训练效率。

实验数据显示，DanceOPD在四大测试场景中均表现优异。在文字生图与图像编辑组合任务中，其编辑能力评分较最强对比方法提升8.1%，文字生图能力甚至超越专业模型2%；局部与全局编辑组合场景下，背景更换和风格转换能力分别提升33.5%和12.9%；真实感增强任务中，成功弥合85.3%的画质差距；分类器自由引导吸收任务里，推理效率提升1.4倍且避免过度引导问题。

消融实验进一步验证了设计选择的合理性。硬路由策略较软混合方案提升15.2%性能，单次取经比密集取经效果高出7.9%-16.6%，低噪声区域取经效率是中高噪声区域的1.2-1.4倍。理论分析表明，速度均方误差损失在特定条件下等价于KL散度，为简化训练目标提供了数学依据。

这项研究仍存在局限性。当前框架要求所有模型共享相同状态空间，难以直接应用于架构差异较大的模型组合。对于需要同时执行多种编辑操作的复杂场景，预先设定的路由机制可能不够灵活。研究团队建议后续工作可探索动态路由策略，通过引入判断模型实现更精细的任务分配。

更多>同类资讯

牛津等机构研究：顶尖AI智能体复杂任务表现远逊人类新手

07-01

智元AGIBOT WORLD CHALLENGE仿真评测平台内测携手多方共筑科研新平台

07-01

摩托罗拉发布moto tag 2蓝牙追踪器续航超500天，moto buds 2 plus耳机新增两款配色

07-01

优必选U1系列超仿生机器人来袭：高颜值高智能，开启人机恋爱新体验？

07-01

联想乐享4.0版本上线，以创新底座推动企业级AI迈向“闭环执行”新阶段

07-01

REDMI K90至尊版来袭！狂暴双芯+超强散热，2999元起开启游戏新体验

06-30

Kimi估值跃升至315亿美元新一轮融资启动收入曲线显强劲增长态势

06-30

小红书内部启动达尔文项目员工参与孵化或迎职级跃升与新品诞生

06-30

字节跳动入股拓扑之源，公司注册资本大幅增至44.39亿人民币

06-30

上纬新材CEO田华首谈布局：个人机器人赛道，如何抢占未来市场先机？

上纬新材CEO田华日前接受了界面新闻等媒体的采访，这是田华履新首席执行官以来首次正式对外发声，同时也是上纬新材首次对外详细拆解其在个人机器人赛道的布局逻辑。他说所有技术难题最后都是材料问题，上纬新材在轻量化…

06-30

优必选2026全球发布U1系列超仿生人形机器人，定位情感陪伴，订单已破1.1万台

其中，优世界 U1 Ultra 男款 99 万元、女款 88 万元；U1 Pro 为 16.98 万元，U1 Lite 为 11.98万元（IT之家注：前 5000 名用户可享受 1 万抵 2 万特别权…

06-30

大疆无人机飞控应用DJI Fly鸿蒙版正式登陆华为应用市场功能丰富便捷

IT之家 6 月 30 日消息，据多名IT之家读者投稿，大疆旗下无人机飞控应用 DJI Fly 现已正式上架 HarmonyOS鸿蒙应用市场，支持连接无人机、通过 Wi-Fi 查看相册、快捷传输素材到手机，…

06-30

千亿女首富周群飞首投具身智能，跨维智能凭啥获资本与市场双重认可？

事实上，蓝思和跨维的合作早于这笔投资，跨维的PickWiz具身智能软件和传感器，已经在蓝思的工厂现场跑过柔性分拣和柔性装配的真实任务。为了满足模型需求，在落地能力上，跨维没有一开始就押注人形机器人整机，而…

06-30

平衡车选购指南：九号迷你、小米等五款热门产品，哪款才是你的出行好伙伴？

我们将重点分析九号迷你平衡车、小米平衡车、Segway、Ninebot和Airwheel等五款产品，比较它们的性能、设计、续航、性价比等多个维度。接下来是Ninebot平衡车，Ninebot是Segway的子…

06-30

电动平衡车怎么选？小米有品、Ninebot等五款热门产品对比，帮你挑到心仪款

我们将重点关注小米有品新款mini智能电动平衡车，以及NinebotS、InMotionL8、AirwheelS3和SegwayminiPRO这几款产品。NinebotS的设计更为简约，适合城市通勤，但在越野…

06-30

点击查看更多 +

全站最新

REDMI K90至尊版来袭！狂暴双芯+超强散热，2999元起开启游戏新体验

雷军谈小米SU7 Ultra纽北表现：立志打造比肩保时捷特斯拉的梦想座驾

织密算力网络郑州打造全国算力“数纽”赋能数字中国建设

鸿蒙智行智界V9旗舰MPV受热捧 6月交付量突破5000台大关

14个月10万辆达成，东风日产以体系力破局新能源市场

现代汽车或效仿丰田：主流车型加速混动转型，纯燃油车渐行渐远

热门内容

本栏最新

REDMI K90至尊版来袭！狂暴双芯+超强散热，2999元起开启游戏新体验

雷军谈小米SU7 Ultra纽北表现：立志打造比肩保时捷特斯拉的梦想座驾

14个月10万辆达成，东风日产以体系力破局新能源市场

雷军谈小米SU7 Ultra纽北佳绩：初心铸就梦想之车，国产新能源闪耀全球赛道

纽北赛道见证中国电车实力！小米SU7 Ultra车主跑出佳绩，雷军发文致谢

AI创新研学之旅启程！7月23-24日探访北大京东百度商汤科技领航未来

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.