滚动资讯

当前位置：首页 > 资讯 > 商业消费 > 正文内容

网购试衣难题将破解？AI新研究让虚拟试衣“量体裁衣”成现实

时间：2026-04-18 05:08:26 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

网购服装时，消费者常陷入这样的困扰：模特展示效果完美，买回家却发现尺码不合，不是过于宽松就是紧绷不适。如今，一项由美国科研团队完成的研究，为破解这一难题带来新希望。该研究通过构建大规模数据集与开发新型AI模型，让虚拟试衣技术能精准呈现不同尺码服装的实际穿着效果。

传统虚拟试衣技术存在明显短板。现有技术多是将服装外观直接贴合到模特身上，无论身材是XS还是3XL，模特轮廓与服装外观均保持不变，导致试穿效果失真。例如，XS码紧身T恤穿在高个子身上，袖子短、胸口紧、腰线上移等细节，以及3XL码宽松外套穿在娇小身材上肩线垂、袖子长等问题，现有AI系统均无法准确呈现。研究团队指出，问题根源在于缺乏合适的训练数据。电商网站商品图多展示合身状态，缺乏“穿错码”的样本，导致AI难以学习不同尺码的实际穿着效果。

为解决数据难题，研究团队创建了名为FIT的大规模数据集。该数据集包含超过113万组图片样本，每组样本均附带精确的人体测量数据与服装测量数据，覆盖从极度宽松到极度紧绷的各种穿着场景。数据集涵盖168种不同体型，包括82种男性体型与86种女性体型，尺码范围从XS延伸至3XL，并记录超过15万种上装与外套设计。这一数据集为训练能理解尺码信息的AI模型提供了坚实基础。

FIT数据集的构建依赖物理仿真技术。研究团队使用GarmentCode参数化编程框架，精确描述服装的缝纫图样，如领子大小、袖子长度、腰围尺寸等。通过将为特定体型设计的裁剪图样套用到不同尺寸的人体模型上，并利用物理仿真引擎计算布料拉伸或堆积时的真实物理变化，包括褶皱位置、布料下垂方式、紧绷纹路走向等，从而生成逼真的穿着效果。为解决仿真过程中的技术挑战，研究团队开发了“框架重新对齐”方法，确保仿真能够成功运行。他们还修改了GarmentCode的默认行为，让系统先单独模拟下装形变，再叠加上衣，实现上下装自然层叠关系。仿真完成后，研究团队将3D模型重新姿势化，从528种日常姿势中随机选取一种，使图片更接近真实场景。

物理仿真生成的3D渲染图虽能呈现服装形状与人体轮廓，但质感单一，缺乏真实感。为解决这一问题，研究团队设计了“重新上色”流程。他们利用法线贴图记录物体表面点的朝向信息，将立体形状信息编码成图像。通过训练基于Flux.1-dev的重新上色模型，输入法线贴图与文字描述，输出具有真实质感的人物图片，同时保持服装形状与人体轮廓不变。研究团队还补充了细节处理步骤，如为3D人物模型添加真实面部特征、发型与鞋子，整合部位法线信息到合成法线贴图中，以及准备72种不同布料类型，随机选择注入文字描述，增加布料多样性。

训练虚拟试衣AI需要配对数据，即同一个人、同一姿势穿着不同衣服的图片，并配有衣服平铺图。然而，现实世界中几乎无法找到这样的配对数据。现有解决方案多是用AI“假造”配对图，但假造图可能存在错误，影响模型训练效果。FIT数据集的合成流程天然解决了这一问题。研究团队固定同一个3D人体模型与姿势，仅换上不同衣服，即可得到真正配对的图片对。在此基础上，他们设计了身份保持生成流程，通过遮掉主图中衣服覆盖区域，保留头部、背景、手臂等非服装区域形成“身份底图”，再结合目标衣服的法线贴图与文字描述，让重新上色模型在保持身份底图细节的前提下，生成穿着新衣服的效果。至于衣服平铺图，研究团队则用另一个AI工具直接从试衣图片中“脱下”衣服生成。

有了高质量训练数据，研究团队开发了名为Fit-VTO的AI模型。该模型输入包括平铺商品图、穿着者参考图与一组测量数值。测量数值包含七个维度，人体侧有身高、胸围、腰围、臀围，服装侧有衣长、胸宽、袖长。为让AI理解这些数字，研究团队设计了专门的“测量值编码器”，采用傅里叶特征嵌入技术，将单个数值扩展成一组有规律变化的波形信号，让神经网络更容易捕捉数值间细微差异。在模型架构上，Fit-VTO基于Flux.1-dev的多模态扩散变换器骨架，人物参考图编码与目标图片在通道维度上拼接，服装图编码与其他信息在序列维度上拼接。整个模型只需训练少量LoRA参数，节省大量计算资源。

为检验Fit-VTO的表现，研究团队在VITON-HD数据集与FIT测试集上进行了测评。在配对图片生成质量方面，Fit-VTO的“遮掩区域L1距离”得分为1.61，明显优于语言模型方法、虚拟试衣模型方法与修复模型方法。在试衣质量方面，Fit-VTO在FIT测试集的几乎所有指标上均表现最佳，特别是在衡量尺码准确性的IoU指标上，得分为0.955，远高于次优方法。在VITON-HD数据集上，Fit-VTO未微调时综合表现与专门训练的IDM-VTON相当，微调后则在绝大多数指标上进一步超过IDM-VTON。消融实验也验证了各个组件的贡献，如真实数据与FIT数据结合、专门测量编码器的必要性等。

尽管研究取得显著进展，但仍存在一些局限。物理仿真对“紧绷程度”的区分能力有限，难以区分“稍紧”与“极紧”这两种体验差异显著但视觉上几乎一样的状态。测量值之间的相关性会限制独立调节单个维度的能力，如单独调高衣长时，模型可能也会顺带加宽衣服宽度。研究团队表示，下一步计划扩展数据集到下装与全身服装，增加姿势与拍摄角度的多样性，以进一步提升虚拟试衣技术的准确性与实用性。

更多>同类资讯

荣耀Earbuds耳夹式耳机Pro官宣上市：棱角硬朗设计玫瑰金配色时尚吸睛

05-13

Netflix在美国得州遭遇诉讼：平台设计具有成瘾性

05-13

沃尔沃全新纯电轿车ES60路测谍照曝光预计2027年发布

05-13

凤凰新媒体发布2026年一季度财报

05-13

短视频治理迈入新阶段：网信办强制要求六类内容显性标注

05-13

伯爵CEO Benjamin Comar：色彩为笔绘时代，情感作弦联当下

05-13

广汽传祺新款M6 MAX 5月15日登场，家用MPV市场再添实力“卷王”

05-13

特斯拉上海超级工厂：4月出口狂飙超5.3万，全球布局下再启新程

05-13

计划换纯电车？先搞懂这4个关键点，让你购车用车都省心！

05-13

10万内纯电优选！上汽MG4空间大续航足，高阶智驾加持性价比出众

05-13

从混动到智能，一汽丰田凭何稳坐合资燃油车“头把交椅”？

05-13

想换纯电车别冲动！搞懂这4个关键点再买，用车体验直线上升

05-13

宏明双新闪耀第26届立嘉展：全链精密制造实力赋能成渝智造升级

05-13

全新比亚迪元PLUS 5月21日上市科技配置升级续航达630公里

05-13

比亚迪第三代元PLUS 5月21日上市：龙颜设计续航630km 配置全面升级

05-13

点击查看更多 +

全站最新

小米汽车再放大招！四款新车蓄势待发纯血GT、入门款、增程SUV等齐亮相

小米YU7 GT车厘子红实车现身街头官方确认五月末登场纯电SUV市场再添猛将

小米4月销量藏玄机：官宣3万实则3.67万，新势力排名跃升至第二

石头科技荣登人民优选舞台：以用户为本，用科技守护国民居家健康

仰望U8 V3.2 OTA升级来袭：11项新功能加持，全向行车记录仪成亮点

广汽传祺新款M6 MAX 5月15日登场，家用MPV市场再添实力“卷王”

热门内容

本栏最新

广汽传祺新款M6 MAX 5月15日登场，家用MPV市场再添实力“卷王”

特斯拉上海超级工厂：4月出口狂飙超5.3万，全球布局下再启新程

计划换纯电车？先搞懂这4个关键点，让你购车用车都省心！

10万内纯电优选！上汽MG4空间大续航足，高阶智驾加持性价比出众

从混动到智能，一汽丰田凭何稳坐合资燃油车“头把交椅”？

想换纯电车别冲动！搞懂这4个关键点再买，用车体验直线上升

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.