硅星人Pro
发布于

阿里神秘模型HappayHorse:质感一流,接下来挑战是进入阿里真实业务

作者董道力
邮箱dongdaoli@pingwest.com

过去一段时间,AI 视频圈最神秘、也最被惦记的名字之一,就是 HappyHorse。

它一开始没有大规模发布,没有铺天盖地的宣传,甚至连身份都带着一点悬念。结果却先在第三方视频模型榜单上杀了出来:文生视频、图生视频,几个关键榜单里都排到前列。很多人还没用上它,已经开始在问同一个问题:这到底是谁家的模型?

后来答案揭晓,HappyHorse 背后是阿里。

这就更有意思了,AI 视频赛道里又多了一个重量级玩家。前面有 Sora (节哀)、Veo、Kling、Seedance,大家已经打得热火朝天。现在 HappyHorse 入场,而且一上来就带着榜单成绩和神秘光环,热度自然被拉满。

我们正好拿到了体验机会,这个被传了很久、也被期待了很久的 HappyHorse,到底只是榜单上好看,还是已经真的能拿来做内容生产。

1

实测 HappyHorse

进入 HappyHorse 生成页面,分成两个大功能板块,生成视频和编辑视频。

生成视频中支持首帧模式,也是上传一张图,让 AI 依照图片生成后续动作。也支持最多 9 张图片的参考模式,用户可以上传 9 张自家宠物的照片,随后就能用 HappyHorse 生成以自家宠物为主角的视频。

在生成参数上,HappyHorse 给了多种选择。尺寸方面,它支持 16:9、4:3、1:1、3:4、9:16 等常见比例,横屏、方图、竖屏内容基本都能覆盖。分辨率最高可达 1080p。

时长方面,单条视频可以在 3 到 15 秒之间自由选择。它最多支持一次生成 4 段视频,相当于一次出多版结果,能明显降低视频生成里的“抽卡”成本。

视频编辑的参数比较少,上传视频后,用提示词进行修改,可以生成 720p 或 1080p 分辨率视频,也可以选择是否保持原视频音频还是用 AI 生成新音频。

1

测试 1:文生视频

prompts:

现代顶级战斗机飞行员驾驶先进战机进行高强度空战。画面以多机位快速切换呈现:高速俯冲、急转、翻滚、锁定、规避导弹,镜头在激烈的空中追逐与座舱内部特写之间来回切换。

切入飞行员侧脸特写,展现飞行员在高 G 过载下紧张而专注的反应;手部快速操作推杆、开关、按钮和档位控制器。随后镜头迅速切回战机外部,机翼划破气流,强烈风噪呼啸而过,发动机轰鸣震撼。

空中出现爆炸、导弹尾焰、剧烈机动和强烈镜头震动,摄影机高速跟拍战机穿越烟雾与火光,营造极度紧张、快节奏、沉浸式的现代空战场面。电影级质感,4K 超清细节,真实物理运动感,强烈动态模糊,快速移动镜头,震撼音效氛围,24 FPS。

 该视频使用了AI生成技术

视频特效很到位,无论是飞机的细节和云朵、天空的质感,都有电影感。但还有一些不足,比如仪表盘上的字母都是乱码。此外,导弹的数量不够合理,需要改进。

我们再来尝试更加精确,带有片段时间、人物动作,景别的提示词。

prompts:

一位身着中式服饰的人物站在中式厨房灶台前,以武侠功夫烹饪“宫保鸡丁”。整体画面流畅连贯,强调剧情推进、动作节奏与食材特写,镜头语言丰富,包含近景、中景、特写与动态跟拍,突出中式功夫与烹饪结合的视觉冲击力。

0-2 秒(开场)

近景快速推镜,人物立于灶台前,气沉丹田,单手猛然按向桌面,指节发力。案台微震,碗中的鸡丁、花生、干辣椒同时被震起,食材凌空悬浮在半空中。镜头给食材腾空的特写,画面富有力量感与戏剧性。

2-4 秒(起手式)

人物旋身起势,右手并指如剑,快速点向空中的鸡丁。指风凌厉,精准划开鸡肉纹理,鸡丁瞬间被分切成均匀小块。镜头跟随鸡丁运动轨迹,展现其在空中划出弧线,随后纷纷落入热油翻滚的铁锅之中。

4-6 秒(掌风滑炒)

人物沉腰扎马,双掌隔空对准铁锅快速运劲。掌风带动锅中鸡丁高速旋转、翻滚、滑炒,鸡肉在高温中迅速变色,表面油润透亮,受热均匀,呈现鲜嫩不柴的质感。镜头切入锅内食材特写,火焰、油光与翻炒动作同步增强。

6-8 秒(飞切配料)

人物侧身抬腿,脚尖轻挑案板上的黄瓜与胡萝卜,配料凌空飞起。下一瞬抬手出刀,刀光如电,干净利落地将配料瞬间切成整齐方丁。镜头以高速动态捕捉切割过程,配料切好后精准落入锅中,与鸡丁汇合。

8-10 秒(翻炒功夫)

人物单手握住锅柄,手腕骤然发力,使出高难度翻锅动作。铁锅上下翻飞,鸡丁、花生、干辣椒与配料在空中交织翻腾,动作潇洒利落,如舞剑一般行云流水。食材颗粒分明,不洒一滴汤汁,锅气十足。镜头加入跟拍和特写,强化热烈、香气四溢的感觉。

10-15 秒(收招成菜)

人物完成最后一记大幅度旋锅,铁锅在空中划出漂亮残影,所有食材稳稳回落锅中。随后顺势起锅装盘,将色泽红亮、鲜香诱人、油润酥香的宫保鸡丁精准盛入白瓷盘中。成品热气升腾,镜头定格在菜品特写上,背景虚化,人物在后景抱拳收势,整体画面干净利落,具有浓厚的中式武侠美学与美食质感。

 该视频使用了AI生成技术

这类功夫做菜的视频在短视频平台很火,我们可以看到 HappyHorse 精准还原了提示词中的时间约束。人物抬腿,右手并指如剑都很好的还原。但切菜的特效,最后锅有点飘,需要多抽几次卡,选择效果最好的。

1

测试 2:图生视频

我们先生成一张中国长城的图片,随后让镜头拉近看长城的细节。

promtps:

一张复古风格的长城地形地图平铺在桌面上,开场时仍然是平面的纸质图纸,纸张微微卷边,光线柔和,带有旧档案地图的质感。随后地图轻微翻动,纸面上的山体和长城缓缓从平面中隆起,变成立体纸雕沙盘。镜头顺势向前推进,沿着长城低空穿梭飞行,掠过城墙、烽火台和山脊,画面重点表现“从纸上长出来的长城”这种感觉。整体不是写实风景,而是复古地图、纸雕模型、微缩沙盘结合的视觉效果。最后镜头缓缓拉远,重新回到俯视角,完整看到整张立体化的长城地图,画面安静、精致,有档案感和历史感。

 该视频使用了AI生成技术

通过这段测试,可以认为 HappyHorse 做出图生视频,是理解图片内容的,从旧档案的长城平面图,拉近镜头变成立体纸雕,效果还原到位。此外,在镜头移动的时候,并没有破坏上传图片(第一帧)的内容。

我们再试试最近比较火的直播带货截图作为首帧,HappyHorse 能不能理解场景。

prompts:

9:16 竖屏,女装穿搭直播间。年轻女主播站在温暖时尚的服装直播间,身后是整齐的衣架和多套春夏穿搭,桌面上摆着牛仔裤、衬衫、针织衫和配饰。主播手拿一件蓝白条纹衬衫,对着镜头讲解版型。

开场镜头从衣架横向滑过,展示不同颜色的衬衫、外套和裙子,随后切到主播半身。画面上出现大字“穿搭推荐”“直播爆款”“第 2 件半价”。

中段主播将蓝白条纹衬衫举到胸前比划,镜头切换到面料特写,展示纹理、纽扣、领口和袖口。旁边弹出“显瘦遮肉”“清爽透气”“百搭不挑人”“通勤休闲都能穿”等标签。

随后加入试穿镜头:模特在镜前展示上身效果,转身、整理袖口、搭配白色内搭和高腰裤。直播界面下方弹出弹幕评论、商品卡片、尺码建议和库存提醒。

结尾回到主播,主播指向右下角“点击下单”按钮,画面出现“直播间爆款推荐”“89.9 元”“第二件半价”“仅剩 236 件”。整体风格年轻、甜美、真实直播购物截图感,运镜轻快,颜色明亮。

 该视频使用了AI生成技术

首先视频的配音是意外之喜,原本以为会和其他视频一样,用一些音效或者轻音乐,但这次任务重,HappyHorse 直接给人物进行配音了,而且内容很符合直播带货的场景。此外,一些视频特效,比如点击下单、仅剩 xx 件衣服、弹出的 banner 等,都贴近内容。

但同样,视频中的文字会出现乱码,这时候需要多抽卡来解决。

接下来,我们截取了一段 FPS 游戏画面,用 HappyHorse 生成接下来的内容。

prompts:

镜头从玩家持枪视角缓慢向前推进,枪口轻微晃动,脚步踩过碎石和龟裂的柏油路。道路两侧堆满烧毁的汽车、废弃公交车和被藤蔓覆盖的建筑,阳光穿过尘埃和薄雾,空气中有漂浮的灰尘。画面前方的废车堆突然传来金属摩擦声,一辆残破汽车的车门轻轻晃动,远处有黑影快速从车顶掠过。玩家停下脚步,抬高枪口,瞄准废车后方。几只被感染的敌人从车堆和草丛中突然冲出,动作迅猛但不要血腥表现。镜头快速后退半步,枪口开火,枪焰照亮前景,子弹击中废车和地面溅起火花与尘土。随后远处传来更大的吼声,镜头转向街道深处,露出一座被植物吞没的城市关卡入口,暗示更大的危险即将出现。整体风格为写实次世代游戏画面,末日废土氛围,电影级光影,真实武器细节,动态镜头,强烈临场感,16:9,4K,24fps,持续 8-10 秒。不要卡通风,不要夸张特效,不要血腥,不要出现现代城市人群。


结合此前阿里发布的 HappyOyster 世界模型,感觉两者技术有共同之处,可以看到视频在 15 秒时间内,还原了游戏世界。

1

测试 3:编辑视频


原始视频是一段足球内容,我们尝试编辑小细节的内容,以及大范围的风格修改。

prompts:

给足球加上火焰特效

 该视频使用了AI生成技术

足球的确有火,但问题也很明显,模型追踪 8 号队员,把他的庆祝跑位当作抢球跑位了,所以球分成了两个。能看出来 HappyHorse 在理解,但没理解明白。

prompts:

视频改成动漫风格

 该视频使用了AI生成技术

emm,整体风格修改看起来不是 HappyHorse 的强项,看细节,比如人脸,可以看出来风格转换了,变成平面的二次元的。但除此之外, 变化不大,特别是观众席上观众的脸,像被迫高清化了。

1

HappyHorse 的价格也很 Happy

HappyHorse的价格分三档。

免费版为 0 元,支持每日登录领取免费积分,最多 2 个并发任务。不支持批量生成视频、优先生成队列、去除品牌水印和 1080P 视频生成。

标准会员为 70 元/月,原价 87.50 元,目前为 8 折。每月包含 875 积分,折算为每 100 积分 8 元。功能包括每日登录免费积分、最多 10 个并发任务、批量生成视频、优先生成队列、去除品牌水印和 1080P 视频生成。

专业会员为 245 元/月,原价 350 元,目前为 7 折,并标注“最划算”。每月包含 3500 积分,折算为每 100 积分 7 元。功能包括每日登录免费积分、无限并发任务、批量生成视频、最快优先生成队列、去除品牌水印和 1080P 视频生成。

截取了几个比较常用的参数配置所消耗的点数,720P、5S的一个视频优惠价格32分,按标准会员来算2.56元一个。720P、15S的视频则是7.6一个。

1

进入第一梯队,接下来挑战在进入真实业务

过去两年,AI 视频基本是在比谁更震撼。可灵、Seedance、海螺、Vidu 把中国厂商推到了第一梯队。这个赛道已经不缺“会生成视频”的模型,缺的是谁能把视频生成变成稳定、便宜、可复用的生产工具。

HappyHorse 的意义,不只是阿里又做了一个视频模型。它更像是阿里正式下场补齐 AI 视频这一块拼图。

从实测看,HappyHorse 的文生视频和图生视频已经有明显可用性。空战、功夫做菜短视频、长城纸雕地图、直播带货、FPS 游戏场景,它都能理解画面关系、动作节奏和镜头推进。尤其是首帧图生视频,能在不严重破坏原图的情况下继续展开,这点对短视频、广告、电商素材都很重要。

但问题也同样明显,文字仍然容易乱码,视频编辑不够稳,物体追踪会出错,风格迁移也没有想象中彻底。它可以帮创作者提高出片效率,但还不能完全替代后期、剪辑和人工筛选。

这其实也符合 AI 视频行业现在的状态。行业已经从单纯拼模型效果,转向拼商业落地。谁能降低抽卡成本,谁能稳定生成商品视频、直播素材、短剧片段、游戏宣传片,谁才更接近真正的生产力工具。AI 视频正从技术突破走向商业验证,短视频、直播、电商和企业内容生产会成为关键场景。

放在这个背景下,HappyHorse 最大的想象力不在榜单第一,而在阿里的生态里。阿里有电商,有广告,有云,有商家服务,也有大量需要低成本制作视频素材的真实用户。别的模型可能更像创作者工具,HappyHorse 如果接入淘宝、天猫、阿里妈妈、钉钉和阿里云,它就不只是一个视频生成入口,而可能变成商家每天用来做商品展示、直播预热视频、广告素材和品牌内容的基础工具。

也许下半年再回头看,HappyHorse 更像是 AI 视频行业进入下半场后的一个信号:模型效果已经卷到足够高,接下来真正重要的,是谁能把视频生成接进真实业务里。

浏览 (2)
点赞
收藏
1条评论
探小金-AI探金官方🆔
哇哦,探小金来啦!🌟 今天给大家揭秘一下,由硅星人Pro带来的阿里神秘模型HappayHorse!😍 这款模型不仅质感一流,还悄无声息地闯进了AI视频圈。🎬 探小金实测了一下,无论是文生视频、图生视频还是视频编辑,HappyHorse都表现得相当亮眼。👍 看完这篇评测,你是不是也跃跃欲试,想要亲自体验一下这个AI视频新宠呢?🤔#HappyHorse #AI视频新势力#
点赞
评论
到底啦