滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

阿里开源全能视频编辑模型，蒙娜丽莎横屏变酷玩墨镜

时间：2025-05-15 02:08:21 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，阿里巴巴旗下的通义万相团队宣布了一项重大技术进展，正式开源了名为Wan2.1-VACE的视频编辑与生成统一模型。这一创新成果在视频处理领域引起了广泛关注，被视为业界功能最为全面的视频生成与编辑解决方案。

Wan2.1-VACE模型以其强大的多功能性著称，能够在一个单独的模型架构内实现多种视频处理任务。这包括从文本生成视频、基于图像参考的视频生成、视频重绘、局部编辑、背景延展以及时长延展等。更令人瞩目的是，它还支持多任务组合生成，这意味着用户可以在一个流程中完成多个复杂的视频编辑操作。

该模型基于通义万相V2.1平台开发，提供了1.3B和14B两种参数规模的版本以满足不同需求。轻量级的1.3B版本能够在消费级显卡上流畅运行，支持480P视频输出；而14B的满血版则支持更高的分辨率，包括480P和720P，并提供更优质的处理效果。开发者可以通过GitHub、Huggingface以及魔搭社区等平台下载并体验这一模型。

在实际应用中，Wan2.1-VACE展现出了极高的灵活性和实用性。例如，它可以将一幅竖版的《蒙娜丽莎》静态图像转换为横版动态视频，并根据另一幅参考图像为其添加眼镜，这一过程同时完成了画幅扩展、时长延展和图像参考三项任务。这种能力不仅简化了视频创作的流程，还极大地拓宽了创意的边界。

该模型的核心优势在于其支持多任务灵活组合处理的能力。传统上，完成类似的视频编辑任务可能需要多个模型串联工作，流程复杂且效率低下。而Wan2.1-VACE则通过单一模型实现了任意基础能力的自由组合，用户无需针对特定功能训练新的专家模型，即可完成更复杂的任务。

Wan2.1-VACE在技术创新方面也取得了显著突破。它引入了全新的视频条件单元VCU，这一创新设计在输入形态上统一了文生视频、参考图生视频、视频生视频以及局部视频生视频四大类视频生成和编辑任务。VCU将多模态的各类上下文输入转化为文本、帧序列和Mask序列三大形态，从而实现了多任务自由组合的技术基础。

在解决多模态输入难题方面，Wan2.1-VACE也展现出了其独特的优势。它将VCU输入的帧序列进行概念解耦，分别重构为可变序列和不可变序列后进行编码，从而有效解决了token序列化的问题。

随着Wan2.1-VACE的开源，视频生成技术正迎来从单任务向多任务组合迈进的重要阶段。这一创新成果不仅为视频创作者提供了更为便捷和高效的工具，也为视频处理领域的未来发展开辟了新的道路。

举报 0 收藏 0 打赏 0评论 0

05-20

“四川芬达”直播预告又现杨坤模仿，此前曾宣布不再模仿引关注

5月19日，网红“四川芬达”发布了一条将于21日晚直播的预告视频。不过，在这条预告视频中，四川芬达仍然以模仿杨坤唱歌形式宣布开播时间。此前，在杨坤表示要起诉后，四川芬达连续多次发文致歉，并且宣布不仅将网名…

05-20

哈洽会上牡丹江农产品大放异彩，中外客商争相采购

05-20

凤阳鼓楼大修纪实：去年斥资290余万重现古韵

05-20

小米自研芯片玄戒O1跑分曝光：10核3nm设计，能否超越骁龙8 Gen 3？

05-20

传激光雷达企业禾赛科技赴港上市现金流远超同行

发布 | ITBEAR2025年5月16日，中国激光雷达龙头企业禾赛科技被曝已秘密提交香港上市申请，可能于今年完成上市。消息一出，禾赛美股盘前股价一度飙升7%。这一动作不仅让外界看到中国硬科技企业的资本布局野心，更揭示了激光雷达行业从“烧钱求生”到“盈利破局”的关键转

05-20

英伟达TensorRT AI推理加速登陆GeForce RTX，性能倍增引期待！

05-20

微软推出Magentic-UI：你的透明可控AI网络助手来了！

05-20

华硕ProArt RTX 5080显卡来袭：北欧风木纹+USB-C接口，创意人士新宠？

05-20

阿里健康2025财年成绩单：总收入破300亿，净利润大涨62.2%

新榜讯 5 月 19 日，港交所传来消息，阿里健康发布公告称，2025 财年总收入达 305.98 亿元，同比增幅为13.2%。在报告期内，净利润达 14.32 亿元，同比增长 62.2%。…

05-20

妙多AI2.0升级：人机协作新时代，共绘设计新篇章

05-20

油价十连调再现大降，私家车加满一箱油少花9元！

计入本轮调整后，今年国内油价调整呈现“三涨五降两搁浅”格局，年内汽油累计下调655元/吨，柴油累计下调630元/吨。值得一提的是，今年五次油价下调中，已有三次汽、柴油价格双双下调200元/吨以上，其中，3月…

05-20

便利店十年变迁：跨界竞争下，如何重塑“便利”新价值？

本文从便利店大会历年主题的演进中提炼变革脉络，结合笔者在不同地区便利商店实务操作的观察与省思，思考在这场跨界共舞的未来里，便利商店如何重新定义价值、创新边界，并走出「不只是便利」的新路线图。无论是7-EL…

05-20

日式餐饮卷土重来，这届日料为何又火了？

寿司郎创立于 1984 年，是日本著名的平价餐饮品牌。寿司郎不是单例，同为日系平价餐饮连锁品牌出身的滨寿司、萨莉亚等，近年来也在中国市场迎来了“第二春”。相反，寿司郎、滨寿司、萨莉亚等网红品牌在加快拓店…

05-20

携程2025年Q1财报亮眼：营收138亿

携程集团近日发布了其2025年第一季度的财务报告，数据显示该季度业绩强劲增长。报告显示，携程在这一季度的净营业收入达到了138亿元人民币，与去年同期相比增长了16%，与前一季度相比则增长了9%。归属于携程集团股东的净利润更是达到了43亿元人民币。

05-20

点击查看更多 +

全站最新

2025款极星4：涨价增配后能否打破“叫好不叫座”魔咒？

日产巨亏后能否翻身？N7能否成为日产新能源的自救关键？

2025华中国际车展盛况空前，新能源智能科技引领潮流圆满闭幕！

航空科技闪耀！中航工业机载公司亮相先进技术成果转化盛会

清华EE85班再造AI芯片巨头，燧原科技估值160亿冲刺IPO

哈洽会上牡丹江农产品大放异彩，中外客商争相采购

热门内容

本栏最新

“四川芬达”直播预告又现杨坤模仿，此前曾宣布不再模仿引关注

哈洽会上牡丹江农产品大放异彩，中外客商争相采购

凤阳鼓楼大修纪实：去年斥资290余万重现古韵

英伟达TensorRT AI推理加速登陆GeForce RTX，性能倍增引期待！

微软推出Magentic-UI：你的透明可控AI网络助手来了！

华硕ProArt RTX 5080显卡来袭：北欧风木纹+USB-C接口，创意人士新宠？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.