
2026年4月7日前后,一个没人听说过的模型悄悄出现在 Artificial Analysis 视频竞技场的排行榜上。没有发布会,没有官方声明,就这样一路往上爬,直到坐上每个分类的第一名。4月10日,阿里巴巴公开认领,字节跳动的即梦2.0就此被拉下神坛——AI 视频圈有了新的基准线。
这篇文章拆解快乐马-1.0是什么、从哪来、和即梦2.0以及其他竞品的真实差距,以及开源这件事到底是什么情况。
快乐马-1.0 是什么?
快乐马-1.0(HappyHorse-1.0)是阿里巴巴的视频生成模型,做到了大多数竞品现在还做不到的事:一次推理同时生成视频和同步音频。文生视频、图生视频、七种语言的原生口型同步——全程不需要单独的音频后期流程。
模型支持最高 1080p 输出,单张 NVIDIA H100 即可运行,5 秒视频的推理时间约 38 秒。支持文本提示和图片输入,适合社交内容、营销视频或角色对话场景。
让社区真正停下来认真看待它的,不是这张功能清单,而是 Artificial Analysis 的评分数字。快乐马不只是赢了,赢的幅度在 AI 视频评测里前所未见。
谁做的?张迪与阿里的故事
一句话版本:阿里巴巴做的,核心人物是张迪——他在快手做出了可灵(Kling AI)之后,于2025年11月重新回到阿里。
张迪的路径在这个故事里很特殊。他在阿里出道、跳槽快手做出可灵(当时最强的 AI 视频模型之一),中间短暂经历B站,然后回到阿里,牵头组建未来生活实验室,挂在淘天集团 ATH AI 创新部下。这个部门2026年3月16日才正式成立。不到五个月后,他的团队拿下了全球 AI 视频模型第一名。
该模型被认为是在 Sand.ai 和 GAIR Lab 于2026年3月底发布的开源项目 daVinci-MagiHuman 基础上的优化版本,但阿里方面尚未正式确认。
匿名发布是刻意为之。国内 AI 公司用过这个打法——小米此前用 MiMo-V2 做过同样的事。先以匿名身份提交,让模型在真实用户的盲测中自证实力,等排行榜说话再公开身份。这次依然奏效。
4月10日,官方认领以两条推文的形式落地。阿里巴巴集团官方账号发文:"恭喜 @HappyHorseATH 在 Artificial Analysis 视频竞技场排行榜上拿下第1和第2!一个计算领域的里程碑,旅程还在继续。" Artificial Analysis 随即跟进:"揭晓 HappyHorse-1.0 是阿里巴巴最新视频模型!@HappyHorseATH 已在竞技场所有榜单中达到第1或第2名。" 团队官方 X 账号为 @HappyHorseATH。

为什么快乐马-1.0 不一样?
基准分数上的差距是表面答案,更值得搞清楚的是哪里赢了。
快乐马的核心架构差异在于统一的音视频 Transformer。大多数 AI 视频流程分两步:先生视频,再单独加音频。快乐马一次推理同时生成两者——对话、环境音、Foley 音效全部融进同一套模型权重,不是事后拼上去的。这和谷歌 Veo 3 在2025年中期开创的方向一致,但快乐马用一个40层单流自注意力设计,同时处理文本、图像、视频、音频 token。
实际效果:口型同步不需要单独模型,七种语言原生对话,音频和画面在时序上真正对齐,而不是强行拟合。
在 Artificial Analysis 竞技场(真实用户盲测头对头比较)的数据如下:
| 类别 | 快乐马-1.0 | 即梦2.0 | 差距 |
|---|---|---|---|
| 文生视频(无音频) | ~1,384 Elo | ~1,273 Elo | +111 |
| 图生视频(无音频) | ~1,415 Elo | ~1,358 Elo | +57 |
| 文生视频(含音频) | ~1,236 Elo | ~1,224 Elo | +12 |
文生视频111分的 Elo 差距不是小幅领先。换算成盲测胜率大约是58–59%,接近代际差距。
现在可以直接在 HappyHorse AI 视频工作室 上测试输出效果,不需要翻找各种第三方搬运站。
快乐马-1.0 vs 即梦2.0:直接对比
这是大家最想看的对比。字节的即梦2.0在快乐马出现前确实是行业标杆——能力扎实,今天大多数生产流程里仍然是首选。两者的真实差异在这里:
| 快乐马-1.0 | 即梦2.0 | |
|---|---|---|
| 开发方 | 阿里 ATH / 未来生活实验室 | 字节 Seed 团队 |
| 文生视频 Elo(无音频) | 1,384 | 1,273 |
| 图生视频 Elo(无音频) | 1,415 | 1,358 |
| API 可用性 | ❌ 仅 Beta | ✅ 已上线(fal.ai、即梦、剪映) |
| 单次视频时长 | ~5–8 秒 | 最长 15 秒 |
| 输入灵活性 | 文本 + 图片 | 最多9张图 + 3段视频 + 3段音频 |
| 原生音频 | ✅ 7种语言 | ✅ 8种以上语言 |
| 开源 | 承诺中,尚未发布 | 闭源 |
| 定价 | 未公布 | 按积分计费,约 $0.022/秒 |
直接结论:快乐马赢评测,即梦2.0赢可用性、时长和输入灵活度。这周要交片,即梦2.0依然是正确选择。想测当前盲测质量最高的输出,用快乐马。
即梦2.0的15秒时长和多输入支持对长内容生产流程有实质价值。快乐马5–8秒的输出更适合短视频——社交切片、开头钩子、带对话的人物特写。
与可灵、Sora、Veo、Runway 的对比
2026年4月初,竞争格局发生了明显变化:
可灵3.0(快手) 约 Elo 1,240,落后快乐马144分。讽刺之处显而易见:张迪离开快手之前做的就是可灵,他的新模型现在超过了它。可灵的4K分辨率和最长3分钟时长在特定场景仍有优势。
Sora(OpenAI) 基本退场。OpenAI 2026年3月底宣布 Sora 关停,API 将于9月24日下线。快乐马领先 Sora 2 Pro 整整189个 Elo 分。AI 视频生成的市场话语权已经实质性地转移到中国厂商。
Veo 3/3.1(谷歌) 落后165–174分,但在电影感稳定性和4K输出上仍是最强选项,且已商业化可用。
Runway Gen-4.5 落后161分。特效、风格化内容和创意探索的灵活性依然最强,但没有原生音频生成。
规律很清晰:快乐马赢质量测试,其他所有模型赢可获得性。哪个更重要,取决于你在做什么。
快乐马-1.0 开源了吗?GitHub 上有什么?
这是社区发布后问得最多的问题。现在的答案是:尚未开源,尽管已经做出承诺。
阿里方面承诺以 Apache 2.0 许可证发布基础模型、蒸馏模型、超分辨率模块和完整推理代码。HuggingFace 上已有模型卡(huggingface.co/happyhorse-ai/happyhorse-1.0),团队的公开表态也指向计划中的开源发布。
截至2026年4月12日:官网的 GitHub 链接显示"coming soon",权重尚未发布。目前唯一活跃的 GitHub 仓库是社区维护的信息汇总(brooks376/Happy-Horse-1.0),仓库本身明确声明这不是官方仓库,模型权重还没有放出来。
如果 Apache 2.0 发布落地,将成为历史上排名最高的开源视频模型,远超当前开源第一阵营的 Elo 1,100–1,130——差距超过250分。对自部署推理或想基于开源权重做二次开发的团队来说,这会是一个重大转折点。发布时的硬件门槛不会低:基线是 NVIDIA H100 或 A100(48GB+ 显存),支持 FP8 量化以实现单 GPU 部署。
目前访问快乐马输出效果的实际路径,是通过已集成该模型的平台——包括 HappyHorse AI 视频工作室,无需 API Key 或自备 GPU 即可直接使用。
快乐马 AI 免费吗?
官方定价尚未公布。目前处于 Beta 阶段,阿里方面表示定价将在正式发布时公布。
需要特别提示:4月10日公开身份后,打着"快乐马"旗号的第三方站点数量急剧增加,这一问题已被国内科技媒体明确点名。目前已出现十余个域名,包括 happyhorse-ai.com、happyhorseai.com、happy-horse.ai、happyhorse.app、happyhorse.video 等,部分站点提供月费19.90–59.90美元的订阅方案。
这些都是第三方套壳服务。在订阅任何平台之前,请务必确认你实际付费的是什么。
快乐马-1.0 什么时候发布的?
模型于2026年4月7日前后以匿名身份出现在 Artificial Analysis 视频竞技场。2026年4月10日,阿里巴巴集团官方 X 账号发文祝贺 @HappyHorseATH "在 Artificial Analysis 视频竞技场排行榜上拿下第1和第2",Artificial Analysis 同步揭晓其阿里身份,随后经 CNBC 和彭博社报道。从张迪2025年11月回到阿里算起,到模型登上排行榜,开发周期约五个月。
截至2026年4月中旬仍处于 Beta 阶段,正式上线日期尚未公布。
快乐马真正擅长什么?
基于当前评测数据和社区测试,模型在以下场景表现最突出:
- 人像与对话视频 — 单人物场景、原生口型同步、面部渲染质量。这是快乐马与竞品 Elo 差距最大的地方。
- 短视频社交内容 — 5–8秒的时长天然适配平台开头、抖音钩子、Reel 封面。
- 多语言内容 — 七种语言原生音频生成,无需另接配音流程。
- 图生视频动画 — 图生视频 Elo(1,415)甚至强于文生视频。
以下是快乐马-1.0 的真实生成样例:
社区测试也揭露了局限性:多人物场景和复杂动态场景下质量明显下降。快乐马的优势集中在人像、对话驱动的内容里——但说公平点,这正好覆盖了大多数创作者的实际需求。
更大的背景
快乐马-1.0 出现在一个特殊节点:OpenAI 刚退场,字节在全球扩张时面临好莱坞版权诉讼,谷歌的 API 仍然不对外开放。AI 视频生成的全球排行榜,现在已经是阿里、字节、快手的主场。
快乐马能否把评测上的优势转化为产品层面的主导地位,取决于两件事:开源发布(决定能否解锁全球自部署需求)和 API 上线(决定能否在分发渠道上与即梦2.0竞争)。
现在的事实是:它是盲测人类偏好中最好的 AI 视频模型,第二名的差距是真实的,而且不小。问题是这种性能优势何时——以及能否——在规模化生产中变得可触达。
想在 API 开放之前提前体验快乐马的输出效果,HappyHorse AI 视频工作室 现在已经上线。
评测数据来源:Artificial Analysis 视频竞技场,截至2026年4月12日。Elo 分数反映真实用户盲测头对头比较的人类偏好结果。所有竞品的可用性和定价信息以发布时为准——AI 视频生成领域变化极快,细节会频繁更新。

