在AI视频生成领域,一款名为HappyHorse-1.0的神秘模型突然成为焦点。这款模型在Artificial Analysis的Video Arena排行榜上强势登顶,不仅在文本转视频赛道以1375的Elo分数领先第二名Seedance 2.0约100分,更在图像转视频赛道创下1409的历史最高分,甚至在有音频赛道也超越Seedance 2.0夺得全球第一。
技术层面,HappyHorse-1.0采用40层单流Transformer架构,支持音视频同步生成,仅需8步去噪即可输出1080P视频。在H100显卡上生成5秒片段仅需38秒,推理速度较传统模型显著提升。其创新点包括多模态统一建模、无CFG引导生成等技术,并原生支持中(含粤语)、英、日、韩、德、法等多种语言。更值得关注的是,该模型计划完全开源,基础模型、蒸馏模型、超分算法及推理代码都将对外开放。
关于模型归属,行业猜测集中在国内科技企业。其中,阿里旗下淘天集团未来生活实验室成为最热门候选,该实验室由技术专家张迪领衔。张迪拥有上海交通大学本硕学历,职级P11,直接向淘天集团首席科学家郑波汇报。其职业经历涵盖阿里、快手和哔哩哔哩:2010年加入阿里负责大数据与机器学习架构;2020年转战快手主导可灵大模型研发;2025年短暂任职哔哩哔哩技术负责人后,于同年11月重返阿里执掌未来生活实验室。
目前HappyHorse-1.0尚未建立官方网站,也未发布技术报告或开源代码,市面上出现的所谓"官网"均已被证实为假冒。据知情人士透露,开发团队正在加班完善相关材料,预计将在近期正式发布。这款模型的突然崛起,不仅改变了AI视频生成领域的竞争格局,其开源计划更可能推动整个行业的技术进步。随着发布日期临近,业界对这款"黑马"模型的期待持续升温。











