2026-04-13 02:30:10 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： HappyHorse1.0是一款15B参数开源AI视频生成模型，于2026年4月8日空降ArtificialAnalysis视频竞技场双榜第一，文生视频ELO1347分领先第二名60分。该模型采用极简40层Transformer架构，仅需8步采样即可生成1080p视频，支持原生音视频联合生成与6种语言口型同步。由阿里巴巴张迪团队开发，将通过百炼平台商业化，提供在线体验与开源部署方案。 综合评分： 85 文章分类： AI安全,解决方案,产品介绍,技术标准,其他

cover_image

Happy Horse开源AI视频生成模型空降屠榜，领先Seedance2.0一大步！

原创

我真tm厉害我真tm厉害

黑客茶话会

2026年4月12日 13:18 山东

在小说阅读器读本章

去阅读

ARTIFICIAL ANALYSIS BLIND TEST #1

一匹黑马空降屠榜 Sora 2 Pro跌至第20名

Happy Horse 1.0 — 15B参数开源模型，文生视频/图生视频双榜第一

1347

文生视频 ELO

1391

图生视频 ELO

15B

参数规模

38s

1080p生成

01 / 匿名空降，屠榜

2026年4月8日，一个名为 HappyHorse-1.0 的匿名模型悄然登上 Artificial Analysis 视频竞技场排行榜。

然后，屠了榜。

文生视频盲测 ELO 1347，图生视频盲测 ELO 1391，双榜第一。文生视频领先第二名字节跳动的 Seedance 2.0 整整 60分 — 在盲测体系中，超过50分即被视为”明显优势”。

60分意味着什么？相当于第二名到第十九名的分差总和。

AI Video Arena — Text to Video 排名（2026.04.08）

| | | | | — | — | — | | #1 | HappyHorse-1.0 | 1347 | | #2 | Seedance 2.0（字节） | 1287 | | #3 | PixVerse V6 | ~1260 | | … | | | | #20 | Sora 2 Pro（OpenAI） | ~1170 |

没有发布会，没有预热博客，甚至没有公司署名。它就这么空降了。

02 / 确系阿里，张迪领衔

两天后，谜底揭晓。

钛媒体从多方确认：HappyHorse-1.0 确系阿里巴巴研发，由前快手副总裁、可灵AI技术负责人张迪领衔。

张迪的履历堪称中国AI视频圈的”全明星”：

张迪 — AI视频领域核心人物

• 2010 上海交大毕业，加入阿里巴巴

• 2020 跳槽快手

• 2024 以”技术一号位”身份牵头可灵AI全链路研发

• 2025.08 卸任可灵技术负责人并离职

• 2025.09 短暂加入B站（约两个月）

• 2025.11 回归阿里巴巴，出任淘天”未来生活实验室”

不到半年，他就带着新东西回来了。而这个新东西，直接把包括前东家快手在内的所有竞争对手按在地上摩擦。

据透露，阿里云将于本月中下旬召开发布会，将 HappyHorse 上线 百炼平台 并开放API。通义实验室已升级为通义大模型事业部，张迪的多模态团队并入其中。

03 / 极简暴力架构

最让人意外的是HappyHorse的技术路线。在大家都追求复杂混合架构的2026年，它选了最朴素的路子：

Happy Horse 1.0 技术架构

• 架构：40层单流Transformer（无交叉注意力）

• 参数：~15B，首尾各4层模态专用，中间32层共享

• 蒸馏：DMD-2（分布匹配蒸馏v2）

• 采样：仅需8步，无需CFG引导

• 推理：MagiCompiler全图编译，额外1.2x加速

• 多模态：Transfusion统一架构（扩散+自回归融合）

8步去噪，无需CFG。

作为对比：Wan 2.2需要约50步，LTX-2 Pro需要约25步。HappyHorse用了别人1/6的步数达到了更高的质量。

官方数据显示，H100上 38秒 即可生成一段1080p视频，256p预览仅需约2秒。

硬件需求方面，推荐H100 80GB或A100 80GB。消费级GPU（RTX 4090/6000 Ada）官方标注”待定”，但以15B的体量来看，24GB显存的4090应该有戏。

04 / 杀手锏：原生音视频

HappyHorse最大的差异化优势，不是画质，不是速度，而是 原生音视频联合生成。

其他模型的做法是：先生成视频，再单独生成音频，最后拼在一起。HappyHorse的做法是：

单次前向传播，同时输出视频 + 对话 + Foley音效 + 环境音

这不是后期合成，是模型原生输出的。声音和画面在token层面就已经对齐。

更硬核的是 多语言口型同步：

English

普通话

日语

韩语

德语

法语

6种语言的口型同步，超低WER（词错误率）。这意味着什么？你用文字描述一个说日语的角色，模型能同时生成精准匹配的口型动作。不需要后期配音对嘴。

在含音频的综合评测中，HappyHorse目前排名第二，仅次于Seedance 2.0（字节的音频专项确实强）。但纯视频质量上，它是毫无争议的第一。

05 / 碾压级对比

开源模型横向对比

| | | | | | | — | — | — | — | — | | | HappyHorse | LTX-2 Pro | Wan 2.2 | HunyuanVideo | | 参数量 | 15B | ~13B | 14B | ~13B | | 原生音频 | Yes | No | No | No | | 口型同步 | 6 languages | 0 | 0 | 0 | | 采样步数 | 8步 | ~25步 | ~50步 | ~50步 | | 商业许可 | Yes | 视协议 | 视协议 | 视协议 |

最刺眼的对比是和自家前代 Wan 2.6 的差距：ELO相差 177分。这不是迭代升级，这是架构级跨越。

而OpenAI的 Sora 2 Pro，曾经的话题王，现在已经滑落到第20名。

06 / 怎么体验？

目前有两条路：

在线体验：happyhourse.com 提供在线生成器，支持文生视频和图生视频。支持720p/1080p/4K，最长8秒。积分制付费，¥219起。

盲测体验：Artificial Analysis官网的 Video Arena 盲测区可以参与投票，随机生成对比视频。虽然不能自定义提示词，但能直观感受质量差距。

官方积分方案

| | | | | — | — | — | | 入门包 | ¥219 | 120积分 | | 创作者包 ⭐ | ¥359 | 210积分 | | 专业包 | ¥719 | 420积分 |

积分永久有效，支持微信/支付宝

开源部署：GitHub已有仓库（huangchen0/Happy-Horse-AI），但模型权重和推理代码尚未发布，标注”coming soon”。承诺将采用允许商业使用和微调的开源协议。

07 / 更大的棋局

HappyHorse的出现不是孤例，而是中国AI视频军团集体发力的缩影。

看榜单头部：阿里（HappyHorse）、字节（Seedance 2.0）、快手（可灵 3.0）— 中国厂商已经包揽了AI视频生成的前三名。Google Veo 3、Runway Gen-4.5、xAI grok-imagine-video都被挤到了后面。Sora 2 Pro更是跌到了第20名。

而这背后是一场人才争夺战。张迪的履历（阿里→快手→B站→阿里）只是冰山一角。Seedance 2.0在春晚的惊艳表现刺激了所有厂商，上半年密集发布新模型已成定局。

阿里云即将在百炼平台上架HappyHorse，面向企业客户推广。多模态模型商业化已经从”能不能做”进入了”谁做得更好更快更便宜”的阶段。

对普通用户和创作者来说，这是好消息。竞争越激烈，工具越强，价格越低。

AI视频的格局，在2026年4月被一匹”快乐马”彻底改写

开源、商用、60分碾压 — 这不是黑马，这是新王

来源：Artificial Analysis、钛媒体、Oimi AI、AI工具集 | 黑客茶话会 2026.04

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：黑客茶话会我真tm厉害我真tm厉害《Happy Horse开源AI视频生成模型空降屠榜，领先Seedance2.0一大步！》