今天一早,全球 AI 观察者的 X信息流被一匹快乐马彻底刷屏了。
在 Artificial Analysis 最新发布的 Video Arena 榜单中,HappyHorse-1.0以前所未有的姿态完成了对行业梯队的强力清洗。
根据今天的实时数据,它在文本转视频(无音频)赛道以1332的 Elo 积分空降第一,直接甩开第二名 Dreamina Seedance 2.0 近 60 分。
在图像转视频(无音频)赛道,它更是跑出了1391的恐怖高分,刷新了该榜单的历史纪录。
即便是在对视听协同要求极高的有音频赛道,这匹“快乐马”也稳稳占据了全球第二的交椅,仅次于Seedance 2.0。
这次事件之所以被称为暴力屠榜,是因为Video Arena的排名机制不是厂商自报的跑分,也不是单次 Demo 的炫技,而是基于数千名真实用户在完全不知情的情况下,对两段生成结果进行“盲测”对比得出的 Elo 体系。
关于这匹“快乐马”的真身,业内早已开启了福尔摩斯模式。
坊间盛传,该模型背后的核心推手,极有可能是由原快手副总裁、可灵技术负责人张迪领衔的新团队。公开资料显示,张迪于 2025 年底加盟阿里,执掌淘天集团“未来生活实验室”。
作为淘天集团的 AI 研发高地,“未来生活实验室”是阿里电商核心算法团队(国内最大的视觉AI应用场景之一),集结了顶尖技术人才与核心算力资源,专注攻坚大模型与多模态等前沿领域,旨在构建底层算法能力并孵化 AI Native 应用。成立仅一年有余,该团队已在国际顶会发表 10 余篇高质量论文,展现出强劲的技术爆发力。
除了团队背景,关于 HappyHorse-1.0 的技术路径也引发了深度讨论。业内盛传,该模型或采用了Transfusion(统一多模态)架构。
这一路径的核心精髓在于:在同一个统一框架内,将离散的文本建模(自回归预测)与连续的视觉信号(Diffusion 扩散模型)进行深度整合。尽管该架构理论上具备“理解与生成”的双重潜力,但 HappyHorse-1.0 显然将重心压在了极致的生成表现上。目前,这种融合架构正成为全球 AI 实验室的竞技重心,因为它能以更高的对齐效率,在保持语言逻辑的同时,显著提升视频生成的连续性与质感。
HappyHorse-1.0 的横空出世,本质上标志着 AI 视频竞赛正式进入了“后 Sora 时代”的深水区。行业的主战场已经从单纯的“能动就行”,进化到了对物理逻辑、运动一致性以及声画对齐能力的综合考量。










