美图公司(01357.HK)近期宣布,旗下美图秀秀、Wink、RoboNeo及开拍等多款产品已完成与通义万相系列模型的深度融合,推出动漫特效生成、AI动态换装等创新功能,为全球用户提供更便捷的视频创作工具。此次技术升级覆盖图像生成、视频编辑及智能创作等多个场景,显著降低了内容制作门槛。
在动态视频生成领域,美图秀秀与Wink结合通义万相首尾帧生视频技术,推出“打歌舞台”“复古美漫”等场景化功能。用户仅需上传单张人物照片,即可生成演唱会现场舞动的动态视频,人物服装与场景动作保持高度一致性。例如“相扑小子”功能可自动将照片转化为相扑选手形象,并匹配传统竞技场景的连贯动作。
针对短视频创作者需求,开拍工具的“创意片头”功能基于图生视频模型开发,用户无需输入复杂指令即可一键生成3秒动态开场。该功能通过垂直领域模型训练,可自动匹配流行网络风格,帮助非专业用户快速制作具有传播力的视频开头。
在风格化创作方面,Wink与RoboNeo搭载通义万相全能编辑模型VACE,推出视频转绘功能。用户可将实拍视频转化为水墨、赛博朋克等20余种动漫风格,同时RoboNeo的文生视频功能支持通过自然语言描述生成动态短视频,例如输入“樱花树下的古风少女”即可自动生成完整场景视频。
作为开源社区最活跃的视频生成模型之一,通义万相自今年2月以来已陆续开源文生视频、图生视频等5大类模型,累计下载量突破3000万次。其技术成果被广泛应用于影视制作、广告设计及电商内容生产等领域,与美图的合作进一步拓展了消费级应用场景。