滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

小红书开源InstanceAssemble：让AI精准还原复杂图像排版

时间：2025-12-26 15:14:41 来源：IT之家编辑：快讯 IP：北京 发表评论无障碍通道

12 月 26 日消息，小红书携手复旦大学，联合推出布局控制生成（Layout-to-Image）领域的突破性方案 InstanceAssemble，通过创新“实例组装注意力”机制，实现了从简单到复杂、稀疏到密集布局的精准图像生成，相关成果已被 NeurIPS 2025 收录。

AI 绘画技术近年来快速发展，从最初的“文字生成图像”（Text-to-Image）逐步迈向“布局控制生成”（Layout-to-Image），后者会根据用户给定的空间布局约束（如边界框 Bounding Boxes、分割掩码 Masks 或骨架图）生成与之对应的图像。

“布局控制生成”技术的难点之一，就是如何让 AI 精确按照用户指定的位置和内容生成图像，面临布局对齐不准、语义脱节或计算成本过高的问题。

而复旦大学与小红书联合发布的 InstanceAssemble 新技术，成功实现了对图像中每个物体的精准布局控制，标志着 AI 绘画进入“可精准构图”的新阶段。

该技术基于当前主流的扩散变换器架构，创新性地提出了“实例拼装注意力”机制。用户只需提供每个物体的边界框位置和内容描述，AI 就能在对应位置生成符合语义的图像内容。无论是简单的几个物体，还是密集复杂的场景，InstanceAssemble 都能保持高精度的布局对齐和语义一致性。

值得一提的是，该技术还采用轻量级适配方式降低使用门槛，无需重新训练整个模型，仅通过约 7100 万个参数（约 3.46% 额外参数），就能适配 Stable Diffusion3-Medium 模型，而适配 Flux.1 模型更是低至 0.84%。

实验中，InstanceAssemble 在包含 90 万个实例的密集布局数据集上表现优异，大幅超越了现有方法。

研究团队为能更准确地衡量布局与图像的匹配程度，还创建了包含 5000 张图像和 90000 个实例的“Denselayout”基准测试集，以及全新的“Layout Grounding Score”（LGS）评估指标。

实验表明，InstanceAssemble 在各种布局条件下均表现优异，即使在训练时仅使用稀疏布局（≤10 个实例）的情况下，也能在密集布局（≥10 个实例）上保持稳健性能。

这项技术已开源，代码和预训练模型可在 GitHub 获取，为设计、广告和内容创作等领域的应用提供了强大支持。

更多>同类资讯

马斯克亲测无安全员Robotaxi自动驾驶网约车，直言体验“完美”

12-26

京东独立购物app“京东AI购”进入内测阶段

12-26

中国首个游戏角色仿生机器人“方承意”亮相

12-26

智元远征A2旗舰版迎来V1.3版本：行走速度提升至1.2m/s

12-26

5000台小米SU7被秒光陈年：只用了1分47秒羡慕嫉妒

12-26

比亚迪汉长续航版推送首次OTA升级：地图新增充电路线功能

12-26

别再像骑自行车一样用 AI 了，那是对法拉利最大的羞辱

12-26

联想将推出超级AI智能体，对标豆包手机助手

12-26

为何家电巨头都做起了「AI眼镜」？

12-26

清华00后博士融资数千万，打造全球现象级端侧算力引擎，性能领跑行业

12-26

你敢相信吗？我把文章喂给NotebookLM生成播客，网约司机误以为是电台节目

12-26

从Shein到Labubu，法国人都在买中国圣诞礼物

12-26

红果短剧11月剧本分账7800万！2家编剧破千万

12-26

卢伟冰发布会口误上热搜小米17 Ultra徕卡版差点卖799元

12-26

比亚迪全系车型搭载豆包大模型！携手火山引擎打造行业最大规模智能座舱AI落地

12-26

点击查看更多 +

全站最新

电动化浪潮下的硬派传承 Jeep Recon以纯电之姿重塑越野新体验

2025汽车行业大变革：十大创新技术引领，开启智能移动空间新纪元

小米17 Ultra徕卡版预售火爆售罄二手平台溢价超两千引关注

特斯拉FSD新动向：行驶中就能提交反馈，优化体验再进一步

汽车保养别被忽悠！老司机教你盯紧3个关键部位，拒绝花冤枉钱

极氪回归赋能吉利：量价齐飞，开启“一个吉利”新征程

热门内容

本栏最新

电动化浪潮下的硬派传承 Jeep Recon以纯电之姿重塑越野新体验

2025汽车行业大变革：十大创新技术引领，开启智能移动空间新纪元

小米17 Ultra徕卡版预售火爆售罄二手平台溢价超两千引关注

技术普惠与全球布局：MG2025年以创新破局开启新百年征程

湖北荆州4A景区元旦免费开放！网红唐艺连唱3天，楚风游园盛宴等你来赴

雷军暂别发布会舞台小米17 Ultra携徕卡登场售价上探7000元档位

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.