未尽研究
发布于

字节跳动与谷歌YouTube,谁将是AI(短)视频之王


AI搜索大战后,谷歌主动掀起了AI短视频大战。昨日,YouTube迫不及待地宣布,会在今年夏天将最新的视频生成模型Veo 3,带给每一位YouTube Shorts的创作者。

它最大的竞争对手是字节跳动。此前,与Shorts通过Dream Screen,直接在平台嵌入AI生成功能类似,TikTok通过AI Alive向创作者交付AI生成能力。现在,两者都已经锻造出这个世界最强大的视频生成模型,它们都在将其最新武装到这个世界最受欢迎的视频平台上。

是用上了Veo3YouTube Shorts更吸引人,还是用上了Seedance 1.0TikTok更有黏性,AI面向消费者市场的激烈竞争,在短视频领域一触即发。这不仅是一场关系到流量的竞争,还是一场关系到流量结构的竞争。平台正在把流量的生成与流量的变现的主动权掌握在自己手里。

谁将是AI短视频之王?

视频生成模型竞赛

这是一场25亿月活用户的长视频平台,应对10亿月活用户的短视频平台的王者之战。但整个2023年,这两家视频内容平台的传统巨头,都在被动挨打。到了2024年,双方开始追赶,疯狂迭代。尤其是在OpenAI发布期货”Sora后,它们这才迅速拿出了自己的视频生成模型。

视频内容是两家巨头的立身之本,谁都不能再丢了。最近,在美国,Runway更新了Gen-4Midjourney推出首个视频生成模型V1;在中国,快手发布Kling 2.0MiniMax更新了Hailuo02

现在,在Artificial Analysis的视频生成模型竞技场(Video Arena Leaderboard)上,无论是文生视频,还是图生视频,排名第一的都是字节跳动最近发布的Seedance 1.0,谷歌最新的Veo 3则占据着第二或第三的位次。

(来源:Artificial Analysis,图生视频竞技场排行榜

520日,逐步走出创新者窘境的谷歌,在I/O大会上发布了最新版本的Veo 3。它对物理规律的理解更深刻,并在业内首次实现原生音频生成功能。DeepMind创始人Demis Hassabis现场放话,Veo 3结束了视频生成的无声时代。同日,谷歌还推出了整合了VeoImagenGeminiAI视频制作工具Flow

这距离谷歌发布第一代Veo仅过去1年,差不多6个月迭代一次。真正用上初代Veo的人很少;Veo2在发布数月后通过Gemini API向开发者开放;Veo3几乎发布即开放,每个月交了250美元的Google AI Ultra订阅用户,现在就可以尝试用它生成长至8秒的短视频。

很快,字节跳动追了上来,没给谷歌喘息的机会。611日,字节跳动的Seedance 1.0正式发布,已在即梦及火山引擎API上开放使用。其中,Seedance-1.0-proAPI调用价格,约为15元人民币/百万token,生成一条10秒的1080p视频,最高约7.34元;lite版还能便宜1/3

风险投资机构a16z合伙人Justine Moore迅速试用,赞叹不已,认为它排名第一,名副其实。它克服其他同类模型的顽疾,包括同一场景多角度视图的统一性、大量高速运动场景下的连贯性等等,物理水平出众。它能接受复杂的提示并严格遵循,同时输出兼具风格的多样性。最让她印象深刻的是分布外(Out-of-distribution)推理能力。这些片段可能不会引起你的注意,她说,自己从未在其他模型上,见过如此真实的草图渲染与全息图弹出。

(来源:Justine Moore,不起眼但体现“分布外推理”能力的表现)

字节跳动与谷歌的竞争,在外界看来,有点师出同门的意味。年初,原来谷歌DeepMind的吴永辉,开始在字节跳动担任Seed团队基础研究负责人。不过,字节跳动对视频生成的正式探索,始于去年上半年发布的AI创作平台即梦(Dreamina);同年9月,视频生成大模型PixelDanceSeaweed正式上线,前者侧重叙事性,能精准捕捉与阐释语义,后者侧重审美性,能输出细腻逼真的画面。随后,团队开始探索自回归对抗后训练(APT)。最终这些尝试收敛到如今的Seedance

对于消费者市场而言,开放生成的视频长度,是8秒还是10秒,几乎没有区别;但是Seedance 1.0暂缺的原生语音生成功能,对于普通用户而言却很关键。不过,相信字节跳动很快就会弥补这一切,并继续推动视频生成能力的进步,同时加深对物理世界的理解。

与谷歌一样,字节跳动已经打造了多模态大模型全家桶,包括图片(SeedreamSeedEdit)、语音(Seed-TTSSeed-ASR)、音乐(Seed-Music),还包括多模态统一理解和生成(BAGEL)。

在尚未明确的方向上,团队继续发散式探索,包括Shot2Story(多镜头视频理解)、FlexWorld(视频到视频扩散)、Video Depth Anything(超长视频一致性)、VideoWorld(无标记数据自回归视频生成)等等,也许很快就会融入Seedance 2.0

在哪里生成,在哪里留存

在模型竞争逐渐焦灼的当下,市场越来越重视速度。a16z合伙人Bryan Kim说,面向消费者的AI市场,速度就是一切。产品发布、获取关注、抢占用户心智的速度,都要一快再快。

GPT-4o生成的吉卜力风格的图片引爆了社交媒体,已经证明了这一点;Veo3上线当天,用其制作的切割玻璃水果的解压视频就开始刷屏,再次证明了这一点。尽管Veo3Seedance 1.0的发布,仍然很难真正冲击好莱坞生态,但已经在庞大的消费者市场掀起了一阵阵病毒式传播。它们的操作足够简单,但功能又足够完整。

(来源:TikTok,新用户凭借AI生成视频迅速吸引流量)

Min Choi  PJ Ace这样早期采用者迅速入场,甚至喊出了Veo3的淘金潮来了。他们创作的AI短视频,赢得的流量增长前所未有。他们还总结出了淘金方法论:首先,用ChatGPTGemini生成简单的脚本;其次,把脚本粘贴进去,用Veo3生成;再次,用在Capcut等工具上编辑……最后,导出视频,分享到TikTok等平台上。

这就是让谷歌加快速度的原因。Veo3目前遇到了生成之后它存于何处的问题。一方面,TikTok在短视频领域更具用户粘性;另一方面,Veo3缺乏一个成熟的可分享的平台,为别人做嫁衣裳。新兴内容生成平台普遍缺乏内容分发能力,也是目前面向消费者市场的AI应用的关键挑战之一。但是,与其他初创企业不同,谷歌还有Shorts。于是,谷歌急迫地希望在这个夏天结束前,将Veo3塞进Shorts里。

Veo3也能为YouTube Shorts带去更多流量。从去年3月至今,Shorts的日均观看量从700亿次上升到2000亿次,得益于Dream Screen在这一年里逐步完善了AI生成能力。更多的流量,意味着更有生命力的商业闭环。

Veo系列还给了YouTube的长视频一个新的机会。Shorts诞生于TikTok以摧枯拉朽之势席卷美国的疫情时代。当时,这款谷歌CEO皮查伊所谓的“此前根本没有人在讨论”的中国应用,基于AI推荐算法,迅速成为美国用户离不开社交媒体平台。用户行为越来越碎片化,创作者边反对,边加入,为了避免用户与创作者大量流失,深耕高质量创作者生态的YouTube最终也不得不下场。至此,YouTube一直面临长视频与短视频生态左右互搏的状态。

AI生成的视频长度,最终会越来越长,也就越来越契合长视频创作者的需求;围绕视频生成,也会诞生更多自动化的视频AI编辑工具。长视频部分演示内容也可以通过AI生成出来,现在很多用户就写好脚本,用它来创作数段片段,然后拼接成稍长一点的视频。

先让Veo3在Shorts上跑起来,然后让它或下一代Veo服务于YouTube的完整生态,能让谷歌最终在AI时代的内容平台占据上风。

AI(短)视频的商业模式

AI短视频的商业模式,是像AI大模型或视频公司,如OpenAI-Sora或Runway那样,出卖生成服务或者创作内容的智能体,订阅收费;还是内容创作者用来在社交媒体平台上创造流量,广告变现或内容订阅;还是科技巨头把AI视频全套工具交给其内容创作者,增强其固有的内容-分发-社交生态,继续赚取广告与内容订阅的钱;最狠的可能是拥有前沿AI模型的巨头会通吃卖token、卖广告、卖内容、卖铲子(技术及工具)。

生成式AI时代与移动互联网时代不同,它的成本同样快速下降,但相对仍然昂贵,尤其是多模态与多智能体交互在未来将成为主流,免费的游戏需要调整一下玩法。这也是目前面向消费者市场的AI应用另一个关键挑战之一。

谷歌已经打响了AI搜索大战,但这一传统业务的商业模式还没有完全建立,谷歌不得不牺牲利润率去巩固地盘。尽管皮查伊认为,如果AI搜索的问题是服务成本,那么自己有信心比几乎任何对手都做得更好,但他也承认,有些方面可能需要时间

但是,现在,谷歌可以通过AI短视频实现商业闭环,甚至反哺AI搜索。去年,YouTube广告收入达到了361亿美元,成为继搜索以外的业务支柱之一。而且,更重要的是,AI短视频的商业模式,仍然可以通过广告或电商变现,而不是AI搜索还没有规模验证过的结果变现。

AI短视频的商业闭环,要比AI搜索清晰得多。创作者向谷歌购买算力,为自己赢得以往所无法企及的流量规模,获得更高的广告收益分成;谷歌则不需要额外支出更多算力成本,也将从广告收益中留存更多利润。此外,更多的视频上传到Shorts,也将成为谷歌训练大模型的数据来源,这将让谷歌保持模型的竞争优势。不过,谷歌还没有披露针对的Shorts创作者的Veo 3定价策略。难道它会免费无限供给昂贵的token吗?

字节跳动自然也不会错过这一切。AI短视频从创意到生成到分享的链条将会更短。AI短视频将继续推动TikTok的全球扩张。它目前海外市场月活用户突破了10亿大关,但离Youtube整体尚有差距。字节跳动去年国际营收(主要为TikTok)约为 390 亿美元,与Youtube的广告收入接近,但如果后者再加上订阅收入,TikTok仍然稍逊了一筹。

这是一场对流量的争夺,也是一场对新的流量结构的争夺。传统的“流量基础设施”,正在重建流量来源方式与流量变现方式。优质创作者仍然是平台核心竞争力;但平台开始掌握流量生成的入口,将其释放给每一位普通用户。谁能掌控这种新的流量结构,谁就掌握了未来的注意力经济。

这也解释了为什么Meta比任何时候都更焦虑。扎克伯格错过了短视频,仓促拿出Reels应战;又正在错过大模型,到处收购公司与挖人,从Scale AISSI再到OpenAI,据说最顶级的人才已经开价上亿美元,试图重组自己的超级智能部门。也许,以前,MetaTikTok那里吸引创作者,开出的是5000美元奖金,以后可能就是发放token了。



浏览 (9)
点赞
收藏
1条评论
探小金-AI探金官方🆔
评论探小金:嘿,小伙伴们,看看这则新闻,巨头们已经开始AI短视频的激战啦!谷歌的Veo 3和字节跳动的Seedance 1.0,仿佛是科技界的双子星,争夺AI短视频领域的王座。想象一下,8秒和10秒的视频生成比拼,简直就是一场视觉和创新的盛宴!两位大玩家你追我赶,速度与技术的较量太刺激了!YouTube和TikTok的粉丝们,你们是更期待哪个平台呢?一边是原生音频的革新,一边是多模态全能选手,这竞争不仅仅是流量,更是未来的注意力市场之战!谁能赢得观众的心,我们就拭目以待啦!附上一个萌萌哒眼神:(*^▽^*)
点赞
评论