快乐马-1.0:阿里拿下 AI 视频全球第一——你需要知道的一切

2026/04/13

快乐马-1.0 排行榜排名

2026年4月7日前后,一个没人听说过的模型悄悄出现在 Artificial Analysis 视频竞技场的排行榜上。没有发布会,没有官方声明,就这样一路往上爬,直到坐上每个分类的第一名。4月10日,阿里巴巴公开认领,字节跳动的即梦2.0就此被拉下神坛——AI 视频圈有了新的基准线。

这篇文章拆解快乐马-1.0是什么、从哪来、和即梦2.0以及其他竞品的真实差距,以及开源这件事到底是什么情况。


快乐马-1.0 是什么?

快乐马-1.0(HappyHorse-1.0)是阿里巴巴的视频生成模型,做到了大多数竞品现在还做不到的事:一次推理同时生成视频和同步音频。文生视频、图生视频、七种语言的原生口型同步——全程不需要单独的音频后期流程。

模型支持最高 1080p 输出,单张 NVIDIA H100 即可运行,5 秒视频的推理时间约 38 秒。支持文本提示和图片输入,适合社交内容、营销视频或角色对话场景。

让社区真正停下来认真看待它的,不是这张功能清单,而是 Artificial Analysis 的评分数字。快乐马不只是赢了,赢的幅度在 AI 视频评测里前所未见。


谁做的?张迪与阿里的故事

一句话版本:阿里巴巴做的,核心人物是张迪——他在快手做出了可灵(Kling AI)之后,于2025年11月重新回到阿里。

张迪的路径在这个故事里很特殊。他在阿里出道、跳槽快手做出可灵(当时最强的 AI 视频模型之一),中间短暂经历B站,然后回到阿里,牵头组建未来生活实验室,挂在淘天集团 ATH AI 创新部下。这个部门2026年3月16日才正式成立。不到五个月后,他的团队拿下了全球 AI 视频模型第一名。

该模型被认为是在 Sand.ai 和 GAIR Lab 于2026年3月底发布的开源项目 daVinci-MagiHuman 基础上的优化版本,但阿里方面尚未正式确认。

匿名发布是刻意为之。国内 AI 公司用过这个打法——小米此前用 MiMo-V2 做过同样的事。先以匿名身份提交,让模型在真实用户的盲测中自证实力,等排行榜说话再公开身份。这次依然奏效。

4月10日,官方认领以两条推文的形式落地。阿里巴巴集团官方账号发文:"恭喜 @HappyHorseATH 在 Artificial Analysis 视频竞技场排行榜上拿下第1和第2!一个计算领域的里程碑,旅程还在继续。" Artificial Analysis 随即跟进:"揭晓 HappyHorse-1.0 是阿里巴巴最新视频模型!@HappyHorseATH 已在竞技场所有榜单中达到第1或第2名。" 团队官方 X 账号为 @HappyHorseATH

阿里巴巴在 X 上官方认领快乐马


为什么快乐马-1.0 不一样?

基准分数上的差距是表面答案,更值得搞清楚的是哪里赢了

快乐马的核心架构差异在于统一的音视频 Transformer。大多数 AI 视频流程分两步:先生视频,再单独加音频。快乐马一次推理同时生成两者——对话、环境音、Foley 音效全部融进同一套模型权重,不是事后拼上去的。这和谷歌 Veo 3 在2025年中期开创的方向一致,但快乐马用一个40层单流自注意力设计,同时处理文本、图像、视频、音频 token。

实际效果:口型同步不需要单独模型,七种语言原生对话,音频和画面在时序上真正对齐,而不是强行拟合。

在 Artificial Analysis 竞技场(真实用户盲测头对头比较)的数据如下:

类别快乐马-1.0即梦2.0差距
文生视频(无音频)~1,384 Elo~1,273 Elo+111
图生视频(无音频)~1,415 Elo~1,358 Elo+57
文生视频(含音频)~1,236 Elo~1,224 Elo+12

文生视频111分的 Elo 差距不是小幅领先。换算成盲测胜率大约是58–59%,接近代际差距。

现在可以直接在 HappyHorse AI 视频工作室 上测试输出效果,不需要翻找各种第三方搬运站。


快乐马-1.0 vs 即梦2.0:直接对比

这是大家最想看的对比。字节的即梦2.0在快乐马出现前确实是行业标杆——能力扎实,今天大多数生产流程里仍然是首选。两者的真实差异在这里:

快乐马-1.0即梦2.0
开发方阿里 ATH / 未来生活实验室字节 Seed 团队
文生视频 Elo(无音频)1,3841,273
图生视频 Elo(无音频)1,4151,358
API 可用性❌ 仅 Beta✅ 已上线(fal.ai、即梦、剪映)
单次视频时长~5–8 秒最长 15 秒
输入灵活性文本 + 图片最多9张图 + 3段视频 + 3段音频
原生音频✅ 7种语言✅ 8种以上语言
开源承诺中,尚未发布闭源
定价未公布按积分计费,约 $0.022/秒

直接结论:快乐马赢评测,即梦2.0赢可用性、时长和输入灵活度。这周要交片,即梦2.0依然是正确选择。想测当前盲测质量最高的输出,用快乐马。

即梦2.0的15秒时长和多输入支持对长内容生产流程有实质价值。快乐马5–8秒的输出更适合短视频——社交切片、开头钩子、带对话的人物特写。


与可灵、Sora、Veo、Runway 的对比

2026年4月初,竞争格局发生了明显变化:

可灵3.0(快手) 约 Elo 1,240,落后快乐马144分。讽刺之处显而易见:张迪离开快手之前做的就是可灵,他的新模型现在超过了它。可灵的4K分辨率和最长3分钟时长在特定场景仍有优势。

Sora(OpenAI) 基本退场。OpenAI 2026年3月底宣布 Sora 关停,API 将于9月24日下线。快乐马领先 Sora 2 Pro 整整189个 Elo 分。AI 视频生成的市场话语权已经实质性地转移到中国厂商。

Veo 3/3.1(谷歌) 落后165–174分,但在电影感稳定性和4K输出上仍是最强选项,且已商业化可用。

Runway Gen-4.5 落后161分。特效、风格化内容和创意探索的灵活性依然最强,但没有原生音频生成。

规律很清晰:快乐马赢质量测试,其他所有模型赢可获得性。哪个更重要,取决于你在做什么。


快乐马-1.0 开源了吗?GitHub 上有什么?

这是社区发布后问得最多的问题。现在的答案是:尚未开源,尽管已经做出承诺

阿里方面承诺以 Apache 2.0 许可证发布基础模型、蒸馏模型、超分辨率模块和完整推理代码。HuggingFace 上已有模型卡(huggingface.co/happyhorse-ai/happyhorse-1.0),团队的公开表态也指向计划中的开源发布。

截至2026年4月12日:官网的 GitHub 链接显示"coming soon",权重尚未发布。目前唯一活跃的 GitHub 仓库是社区维护的信息汇总(brooks376/Happy-Horse-1.0),仓库本身明确声明这不是官方仓库,模型权重还没有放出来。

如果 Apache 2.0 发布落地,将成为历史上排名最高的开源视频模型,远超当前开源第一阵营的 Elo 1,100–1,130——差距超过250分。对自部署推理或想基于开源权重做二次开发的团队来说,这会是一个重大转折点。发布时的硬件门槛不会低:基线是 NVIDIA H100 或 A100(48GB+ 显存),支持 FP8 量化以实现单 GPU 部署。

目前访问快乐马输出效果的实际路径,是通过已集成该模型的平台——包括 HappyHorse AI 视频工作室,无需 API Key 或自备 GPU 即可直接使用。


快乐马 AI 免费吗?

官方定价尚未公布。目前处于 Beta 阶段,阿里方面表示定价将在正式发布时公布。

需要特别提示:4月10日公开身份后,打着"快乐马"旗号的第三方站点数量急剧增加,这一问题已被国内科技媒体明确点名。目前已出现十余个域名,包括 happyhorse-ai.com、happyhorseai.com、happy-horse.ai、happyhorse.app、happyhorse.video 等,部分站点提供月费19.90–59.90美元的订阅方案。

这些都是第三方套壳服务。在订阅任何平台之前,请务必确认你实际付费的是什么。


快乐马-1.0 什么时候发布的?

模型于2026年4月7日前后以匿名身份出现在 Artificial Analysis 视频竞技场。2026年4月10日,阿里巴巴集团官方 X 账号发文祝贺 @HappyHorseATH "在 Artificial Analysis 视频竞技场排行榜上拿下第1和第2",Artificial Analysis 同步揭晓其阿里身份,随后经 CNBC 和彭博社报道。从张迪2025年11月回到阿里算起,到模型登上排行榜,开发周期约五个月。

截至2026年4月中旬仍处于 Beta 阶段,正式上线日期尚未公布。


快乐马真正擅长什么?

基于当前评测数据和社区测试,模型在以下场景表现最突出:

  • 人像与对话视频 — 单人物场景、原生口型同步、面部渲染质量。这是快乐马与竞品 Elo 差距最大的地方。
  • 短视频社交内容 — 5–8秒的时长天然适配平台开头、抖音钩子、Reel 封面。
  • 多语言内容 — 七种语言原生音频生成,无需另接配音流程。
  • 图生视频动画 — 图生视频 Elo(1,415)甚至强于文生视频。

以下是快乐马-1.0 的真实生成样例:

社区测试也揭露了局限性:多人物场景和复杂动态场景下质量明显下降。快乐马的优势集中在人像、对话驱动的内容里——但说公平点,这正好覆盖了大多数创作者的实际需求。


更大的背景

快乐马-1.0 出现在一个特殊节点:OpenAI 刚退场,字节在全球扩张时面临好莱坞版权诉讼,谷歌的 API 仍然不对外开放。AI 视频生成的全球排行榜,现在已经是阿里、字节、快手的主场。

快乐马能否把评测上的优势转化为产品层面的主导地位,取决于两件事:开源发布(决定能否解锁全球自部署需求)和 API 上线(决定能否在分发渠道上与即梦2.0竞争)。

现在的事实是:它是盲测人类偏好中最好的 AI 视频模型,第二名的差距是真实的,而且不小。问题是这种性能优势何时——以及能否——在规模化生产中变得可触达。

想在 API 开放之前提前体验快乐马的输出效果,HappyHorse AI 视频工作室 现在已经上线。


评测数据来源:Artificial Analysis 视频竞技场,截至2026年4月12日。Elo 分数反映真实用户盲测头对头比较的人类偏好结果。所有竞品的可用性和定价信息以发布时为准——AI 视频生成领域变化极快,细节会频繁更新。

Kitty

Kitty