快乐马-1.0：阿里拿下 AI 视频全球第一——你需要知道的一切

快乐马-1.0 排行榜排名

2026年4月7日前后，一个没人听说过的模型悄悄出现在 Artificial Analysis 视频竞技场的排行榜上。没有发布会，没有官方声明，就这样一路往上爬，直到坐上每个分类的第一名。4月10日，阿里巴巴公开认领，字节跳动的即梦2.0就此被拉下神坛——AI 视频圈有了新的基准线。

这篇文章拆解快乐马-1.0是什么、从哪来、和即梦2.0以及其他竞品的真实差距，以及开源这件事到底是什么情况。

快乐马-1.0 是什么？

快乐马-1.0（HappyHorse-1.0）是阿里巴巴的视频生成模型，做到了大多数竞品现在还做不到的事：一次推理同时生成视频和同步音频。文生视频、图生视频、七种语言的原生口型同步——全程不需要单独的音频后期流程。

模型支持最高 1080p 输出，单张 NVIDIA H100 即可运行，5 秒视频的推理时间约 38 秒。支持文本提示和图片输入，适合社交内容、营销视频或角色对话场景。

让社区真正停下来认真看待它的，不是这张功能清单，而是 Artificial Analysis 的评分数字。快乐马不只是赢了，赢的幅度在 AI 视频评测里前所未见。

谁做的？张迪与阿里的故事

一句话版本：阿里巴巴做的，核心人物是张迪——他在快手做出了可灵（Kling AI）之后，于2025年11月重新回到阿里。

张迪的路径在这个故事里很特殊。他在阿里出道、跳槽快手做出可灵（当时最强的 AI 视频模型之一），中间短暂经历B站，然后回到阿里，牵头组建未来生活实验室，挂在淘天集团 ATH AI 创新部下。这个部门2026年3月16日才正式成立。不到五个月后，他的团队拿下了全球 AI 视频模型第一名。

该模型被认为是在 Sand.ai 和 GAIR Lab 于2026年3月底发布的开源项目 daVinci-MagiHuman 基础上的优化版本，但阿里方面尚未正式确认。

匿名发布是刻意为之。国内 AI 公司用过这个打法——小米此前用 MiMo-V2 做过同样的事。先以匿名身份提交，让模型在真实用户的盲测中自证实力，等排行榜说话再公开身份。这次依然奏效。

4月10日，官方认领以两条推文的形式落地。阿里巴巴集团官方账号发文："恭喜 @HappyHorseATH 在 Artificial Analysis 视频竞技场排行榜上拿下第1和第2！一个计算领域的里程碑，旅程还在继续。" Artificial Analysis 随即跟进："揭晓 HappyHorse-1.0 是阿里巴巴最新视频模型！@HappyHorseATH 已在竞技场所有榜单中达到第1或第2名。" 团队官方 X 账号为 @HappyHorseATH。

阿里巴巴在 X 上官方认领快乐马

为什么快乐马-1.0 不一样？

基准分数上的差距是表面答案，更值得搞清楚的是哪里赢了。

快乐马的核心架构差异在于统一的音视频 Transformer。大多数 AI 视频流程分两步：先生视频，再单独加音频。快乐马一次推理同时生成两者——对话、环境音、Foley 音效全部融进同一套模型权重，不是事后拼上去的。这和谷歌 Veo 3 在2025年中期开创的方向一致，但快乐马用一个40层单流自注意力设计，同时处理文本、图像、视频、音频 token。

实际效果：口型同步不需要单独模型，七种语言原生对话，音频和画面在时序上真正对齐，而不是强行拟合。

在 Artificial Analysis 竞技场（真实用户盲测头对头比较）的数据如下：

类别	快乐马-1.0	即梦2.0	差距
文生视频（无音频）	~1,384 Elo	~1,273 Elo	+111
图生视频（无音频）	~1,415 Elo	~1,358 Elo	+57
文生视频（含音频）	~1,236 Elo	~1,224 Elo	+12

文生视频111分的 Elo 差距不是小幅领先。换算成盲测胜率大约是58–59%，接近代际差距。

现在可以直接在 HappyHorse AI 视频工作室上测试输出效果，不需要翻找各种第三方搬运站。

快乐马-1.0 vs 即梦2.0：直接对比

这是大家最想看的对比。字节的即梦2.0在快乐马出现前确实是行业标杆——能力扎实，今天大多数生产流程里仍然是首选。两者的真实差异在这里：

	快乐马-1.0	即梦2.0
开发方	阿里 ATH / 未来生活实验室	字节 Seed 团队
文生视频 Elo（无音频）	1,384	1,273
图生视频 Elo（无音频）	1,415	1,358
API 可用性	❌ 仅 Beta	✅ 已上线（fal.ai、即梦、剪映）
单次视频时长	~5–8 秒	最长 15 秒
输入灵活性	文本 + 图片	最多9张图 + 3段视频 + 3段音频
原生音频	✅ 7种语言	✅ 8种以上语言
开源	承诺中，尚未发布	闭源
定价	未公布	按积分计费，约 $0.022/秒

直接结论：快乐马赢评测，即梦2.0赢可用性、时长和输入灵活度。这周要交片，即梦2.0依然是正确选择。想测当前盲测质量最高的输出，用快乐马。

即梦2.0的15秒时长和多输入支持对长内容生产流程有实质价值。快乐马5–8秒的输出更适合短视频——社交切片、开头钩子、带对话的人物特写。

与可灵、Sora、Veo、Runway 的对比

2026年4月初，竞争格局发生了明显变化：

可灵3.0（快手） 约 Elo 1,240，落后快乐马144分。讽刺之处显而易见：张迪离开快手之前做的就是可灵，他的新模型现在超过了它。可灵的4K分辨率和最长3分钟时长在特定场景仍有优势。

Sora（OpenAI） 基本退场。OpenAI 2026年3月底宣布 Sora 关停，API 将于9月24日下线。快乐马领先 Sora 2 Pro 整整189个 Elo 分。AI 视频生成的市场话语权已经实质性地转移到中国厂商。

Veo 3/3.1（谷歌） 落后165–174分，但在电影感稳定性和4K输出上仍是最强选项，且已商业化可用。

Runway Gen-4.5 落后161分。特效、风格化内容和创意探索的灵活性依然最强，但没有原生音频生成。

规律很清晰：快乐马赢质量测试，其他所有模型赢可获得性。哪个更重要，取决于你在做什么。

快乐马-1.0 开源了吗？GitHub 上有什么？

这是社区发布后问得最多的问题。现在的答案是：尚未开源，尽管已经做出承诺。

阿里方面承诺以 Apache 2.0 许可证发布基础模型、蒸馏模型、超分辨率模块和完整推理代码。HuggingFace 上已有模型卡（huggingface.co/happyhorse-ai/happyhorse-1.0），团队的公开表态也指向计划中的开源发布。

截至2026年4月12日：官网的 GitHub 链接显示"coming soon"，权重尚未发布。目前唯一活跃的 GitHub 仓库是社区维护的信息汇总（brooks376/Happy-Horse-1.0），仓库本身明确声明这不是官方仓库，模型权重还没有放出来。

如果 Apache 2.0 发布落地，将成为历史上排名最高的开源视频模型，远超当前开源第一阵营的 Elo 1,100–1,130——差距超过250分。对自部署推理或想基于开源权重做二次开发的团队来说，这会是一个重大转折点。发布时的硬件门槛不会低：基线是 NVIDIA H100 或 A100（48GB+ 显存），支持 FP8 量化以实现单 GPU 部署。

目前访问快乐马输出效果的实际路径，是通过已集成该模型的平台——包括 HappyHorse AI 视频工作室，无需 API Key 或自备 GPU 即可直接使用。

快乐马 AI 免费吗？

官方定价尚未公布。目前处于 Beta 阶段，阿里方面表示定价将在正式发布时公布。

需要特别提示：4月10日公开身份后，打着"快乐马"旗号的第三方站点数量急剧增加，这一问题已被国内科技媒体明确点名。目前已出现十余个域名，包括 happyhorse-ai.com、happyhorseai.com、happy-horse.ai、happyhorse.app、happyhorse.video 等，部分站点提供月费19.90–59.90美元的订阅方案。

这些都是第三方套壳服务。在订阅任何平台之前，请务必确认你实际付费的是什么。

快乐马-1.0 什么时候发布的？

模型于2026年4月7日前后以匿名身份出现在 Artificial Analysis 视频竞技场。2026年4月10日，阿里巴巴集团官方 X 账号发文祝贺 @HappyHorseATH "在 Artificial Analysis 视频竞技场排行榜上拿下第1和第2"，Artificial Analysis 同步揭晓其阿里身份，随后经 CNBC 和彭博社报道。从张迪2025年11月回到阿里算起，到模型登上排行榜，开发周期约五个月。

截至2026年4月中旬仍处于 Beta 阶段，正式上线日期尚未公布。

快乐马真正擅长什么？

基于当前评测数据和社区测试，模型在以下场景表现最突出：

人像与对话视频 — 单人物场景、原生口型同步、面部渲染质量。这是快乐马与竞品 Elo 差距最大的地方。
短视频社交内容 — 5–8秒的时长天然适配平台开头、抖音钩子、Reel 封面。
多语言内容 — 七种语言原生音频生成，无需另接配音流程。
图生视频动画 — 图生视频 Elo（1,415）甚至强于文生视频。

以下是快乐马-1.0 的真实生成样例：

社区测试也揭露了局限性：多人物场景和复杂动态场景下质量明显下降。快乐马的优势集中在人像、对话驱动的内容里——但说公平点，这正好覆盖了大多数创作者的实际需求。

更大的背景

快乐马-1.0 出现在一个特殊节点：OpenAI 刚退场，字节在全球扩张时面临好莱坞版权诉讼，谷歌的 API 仍然不对外开放。AI 视频生成的全球排行榜，现在已经是阿里、字节、快手的主场。

快乐马能否把评测上的优势转化为产品层面的主导地位，取决于两件事：开源发布（决定能否解锁全球自部署需求）和 API 上线（决定能否在分发渠道上与即梦2.0竞争）。

现在的事实是：它是盲测人类偏好中最好的 AI 视频模型，第二名的差距是真实的，而且不小。问题是这种性能优势何时——以及能否——在规模化生产中变得可触达。

想在 API 开放之前提前体验快乐马的输出效果，HappyHorse AI 视频工作室现在已经上线。

评测数据来源：Artificial Analysis 视频竞技场，截至2026年4月12日。Elo 分数反映真实用户盲测头对头比较的人类偏好结果。所有竞品的可用性和定价信息以发布时为准——AI 视频生成领域变化极快，细节会频繁更新。

快乐马-1.0：阿里拿下 AI 视频全球第一——你需要知道的一切

目录