文章总结: HappyHorse1.0是一款15B参数开源AI视频生成模型,于2026年4月8日空降ArtificialAnalysis视频竞技场双榜第一,文生视频ELO1347分领先第二名60分。该模型采用极简40层Transformer架构,仅需8步采样即可生成1080p视频,支持原生音视频联合生成与6种语言口型同步。由阿里巴巴张迪团队开发,将通过百炼平台商业化,提供在线体验与开源部署方案。 综合评分: 85 文章分类: AI安全,解决方案,产品介绍,技术标准,其他
Happy Horse开源AI视频生成模型空降屠榜,领先Seedance2.0一大步!
原创
我真tm厉害 我真tm厉害
黑客茶话会
2026年4月12日 13:18 山东
在小说阅读器读本章
去阅读
ARTIFICIAL ANALYSIS BLIND TEST #1
一匹黑马空降屠榜 Sora 2 Pro跌至第20名
Happy Horse 1.0 — 15B参数开源模型,文生视频/图生视频双榜第一
1347
文生视频 ELO
1391
图生视频 ELO
15B
参数规模
38s
1080p生成
01 / 匿名空降,屠榜
2026年4月8日,一个名为 HappyHorse-1.0 的匿名模型悄然登上 Artificial Analysis 视频竞技场排行榜。
然后,屠了榜。
文生视频盲测 ELO 1347,图生视频盲测 ELO 1391,双榜第一。文生视频领先第二名字节跳动的 Seedance 2.0 整整 60分 — 在盲测体系中,超过50分即被视为”明显优势”。
60分意味着什么?相当于第二名到第十九名的分差总和。
AI Video Arena — Text to Video 排名(2026.04.08)
| | | | | — | — | — | | #1 | HappyHorse-1.0 | 1347 | | #2 | Seedance 2.0(字节) | 1287 | | #3 | PixVerse V6 | ~1260 | | … | | | | #20 | Sora 2 Pro(OpenAI) | ~1170 |
没有发布会,没有预热博客,甚至没有公司署名。它就这么空降了。
02 / 确系阿里,张迪领衔
两天后,谜底揭晓。
钛媒体从多方确认:HappyHorse-1.0 确系阿里巴巴研发,由前快手副总裁、可灵AI技术负责人 张迪 领衔。
张迪的履历堪称中国AI视频圈的”全明星”:
张迪 — AI视频领域核心人物
• 2010 上海交大毕业,加入阿里巴巴
• 2020 跳槽快手
• 2024 以”技术一号位”身份牵头可灵AI全链路研发
• 2025.08 卸任可灵技术负责人并离职
• 2025.09 短暂加入B站(约两个月)
• 2025.11 回归阿里巴巴,出任淘天”未来生活实验室”
不到半年,他就带着新东西回来了。而这个新东西,直接把包括前东家快手在内的所有竞争对手按在地上摩擦。
据透露,阿里云将于本月中下旬召开发布会,将 HappyHorse 上线 百炼平台 并开放API。通义实验室已升级为通义大模型事业部,张迪的多模态团队并入其中。
03 / 极简暴力架构
最让人意外的是HappyHorse的技术路线。在大家都追求复杂混合架构的2026年,它选了最朴素的路子:
Happy Horse 1.0 技术架构
• 架构:40层单流Transformer(无交叉注意力)
• 参数:~15B,首尾各4层模态专用,中间32层共享
• 蒸馏:DMD-2(分布匹配蒸馏v2)
• 采样:仅需8步,无需CFG引导
• 推理:MagiCompiler全图编译,额外1.2x加速
• 多模态:Transfusion统一架构(扩散+自回归融合)
8步去噪,无需CFG。
作为对比:Wan 2.2需要约50步,LTX-2 Pro需要约25步。HappyHorse用了别人1/6的步数达到了更高的质量。
官方数据显示,H100上 38秒 即可生成一段1080p视频,256p预览仅需约2秒。
硬件需求方面,推荐H100 80GB或A100 80GB。消费级GPU(RTX 4090/6000 Ada)官方标注”待定”,但以15B的体量来看,24GB显存的4090应该有戏。
04 / 杀手锏:原生音视频
HappyHorse最大的差异化优势,不是画质,不是速度,而是 原生音视频联合生成。
其他模型的做法是:先生成视频,再单独生成音频,最后拼在一起。HappyHorse的做法是:
单次前向传播,同时输出 视频 + 对话 + Foley音效 + 环境音
这不是后期合成,是模型原生输出的。声音和画面在token层面就已经对齐。
更硬核的是 多语言口型同步:
English
普通话
日语
韩语
德语
法语
6种语言的口型同步,超低WER(词错误率)。这意味着什么?你用文字描述一个说日语的角色,模型能同时生成精准匹配的口型动作。不需要后期配音对嘴。
在含音频的综合评测中,HappyHorse目前排名第二,仅次于Seedance 2.0(字节的音频专项确实强)。但纯视频质量上,它是毫无争议的第一。
05 / 碾压级对比
开源模型横向对比
| | | | | | | — | — | — | — | — | | | HappyHorse | LTX-2 Pro | Wan 2.2 | HunyuanVideo | | 参数量 | 15B | ~13B | 14B | ~13B | | 原生音频 | Yes | No | No | No | | 口型同步 | 6 languages | 0 | 0 | 0 | | 采样步数 | 8步 | ~25步 | ~50步 | ~50步 | | 商业许可 | Yes | 视协议 | 视协议 | 视协议 |
最刺眼的对比是和自家前代 Wan 2.6 的差距:ELO相差 177分。这不是迭代升级,这是架构级跨越。
而OpenAI的 Sora 2 Pro,曾经的话题王,现在已经滑落到第20名。
06 / 怎么体验?
目前有两条路:
在线体验:happyhourse.com 提供在线生成器,支持文生视频和图生视频。支持720p/1080p/4K,最长8秒。积分制付费,¥219起。
盲测体验:Artificial Analysis官网的 Video Arena 盲测区可以参与投票,随机生成对比视频。虽然不能自定义提示词,但能直观感受质量差距。
官方积分方案
| | | | | — | — | — | | 入门包 | ¥219 | 120积分 | | 创作者包 ⭐ | ¥359 | 210积分 | | 专业包 | ¥719 | 420积分 |
积分永久有效,支持微信/支付宝
开源部署:GitHub已有仓库(huangchen0/Happy-Horse-AI),但模型权重和推理代码尚未发布,标注”coming soon”。承诺将采用允许商业使用和微调的开源协议。
07 / 更大的棋局
HappyHorse的出现不是孤例,而是中国AI视频军团集体发力的缩影。
看榜单头部:阿里(HappyHorse)、字节(Seedance 2.0)、快手(可灵 3.0)— 中国厂商已经包揽了AI视频生成的前三名。Google Veo 3、Runway Gen-4.5、xAI grok-imagine-video都被挤到了后面。Sora 2 Pro更是跌到了第20名。
而这背后是一场人才争夺战。张迪的履历(阿里→快手→B站→阿里)只是冰山一角。Seedance 2.0在春晚的惊艳表现刺激了所有厂商,上半年密集发布新模型已成定局。
阿里云即将在百炼平台上架HappyHorse,面向企业客户推广。多模态模型商业化已经从”能不能做”进入了”谁做得更好更快更便宜”的阶段。
对普通用户和创作者来说,这是好消息。竞争越激烈,工具越强,价格越低。
AI视频的格局,在2026年4月 被一匹”快乐马”彻底改写
开源、商用、60分碾压 — 这不是黑马,这是新王
来源:Artificial Analysis、钛媒体、Oimi AI、AI工具集 | 黑客茶话会 2026.04
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:黑客茶话会 我真tm厉害 我真tm厉害《Happy Horse开源AI视频生成模型空降屠榜,领先Seedance2.0一大步!》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。







评论