阿里巴巴近日宣布其视频生成模型HappyHorse迎来重要升级,正式推出1.1版本。该版本在动态表现、主体一致性、指令响应、画面质感及音频效果等核心领域实现突破性进展,为内容创作者提供更强大的工具支持。
针对视频生成中普遍存在的动作僵硬问题,1.1版本通过优化运动建模算法,显著提升了画面流畅度与力量感。此前版本中出现的动作迟缓、节奏断层等现象得到根本性改善,现在能够更精准地呈现快速移动、激烈打斗等复杂动态场景。在指令理解方面,模型展现出更强的语义解析能力,无论是简短关键词还是长篇叙事描述,都能准确转化为视觉内容,特别在多角色、多场景的复杂叙事中保持镜头编排的稳定性。
主体一致性优化是本次升级的另一亮点。新版本支持同时输入9张角色参考图,通过深度学习技术确保商品细节、品牌标识、人物特征在不同镜头间保持高度统一。这项改进有效解决了多分镜拍摄中常见的"角色变脸"问题,特别适用于直播带货、系列短剧、品牌广告等需要强身份识别的创作场景。测试数据显示,在包含5个以上分镜的项目中,主体识别准确率提升至92%。
视觉呈现方面,研发团队重点解决了"过度美化"的行业痛点。新模型在保留皮肤纹理、毛孔等真实细节的同时,智能调节光影效果,使画面既保持专业质感又避免塑料感。音频模块的升级同样引人注目,现在能够根据场景情绪自动调整语速、停顿和语气,支持通过提示词添加环境音效,使生成的视频具备更完整的沉浸式体验。
技术参数保持原有优势,单次生成时长覆盖3-15秒区间,支持720p/1080p分辨率及自定义宽高比。目前该模型已深度应用于影视制作、电商营销、游戏动画等多个领域,服务客户包括虎鲸文娱集团等头部企业。为促进技术普惠,阿里巴巴同步启动"Horsepower"AI影像大赛,设立百万级商业合作奖励,邀请全球创作者通过HappyHorse官网提交作品,由张纪中等影视界权威人士组成评审团进行评选。







