阿里通义大模型近日迎来重要更新,正式推出了Wan2.2-I2V-Flash模型,该模型不仅将电影级别的视觉效果融入其中,更在生成效率与性价比上实现了显著飞跃。
据官方介绍,Wan2.2-I2V-Flash相较于前代Wan2.1,在推理速度上有了12倍的提升。这一改进意味着用户能够在更短的时间内获得高质量的生成结果。同时,该模型在指令遵循能力上也取得了显著进步,支持多种特效提示词的直接输出,并能精准控制镜头运动,为用户提供了更为灵活和多样的创作空间。
Wan2.2-I2V-Flash在风格保持与动态效果实现上也表现出色。它能够稳定地保持各类风格话图像的特点,并生成合理且自然的动态效果,进一步提升了生成内容的多样性和观赏性。价格方面,该模型以0.1元/秒的亲民价格,为用户提供了高性价比的生成服务。其抽卡成功率相比Wan2.1也提升了123%,进一步增强了用户的体验。
回顾不久前的7月28日,阿里通义大模型还开源了包含文生视频、图生视频和统一视频生成三款模型的Wan2.2版本。其中,文生视频模型和图生视频模型均采用了业界首创的MoE架构,总参数量达到27B,激活参数为14B。这些模型不仅具备强大的生成能力,还创新性地引入了电影美学控制系统,使得生成的光影、色彩、构图、微表情等细节都能媲美专业电影水平。
目前,用户已经可以通过阿里云百炼平台调用API来体验Wan2.2-I2V-Flash模型。这一新模型的推出,无疑将进一步推动阿里通义大模型在视频生成领域的发展,为用户带来更多惊喜和可能。