胡渊鸣 | 真正好玩的 AI 原生游戏
无数人尝试了 AI 和游戏结合,为什么还没有真正现象级的产品?让我们回归第一性原理:游戏要好玩才会有人玩。而已有的 AI + 游戏尝试,还没有让游戏变得更好玩。
“这款游戏啥都好,就只有一个问题:不好玩。” 游戏之神宫本茂对后来的任天堂 CEO 岩田聪如是说。
1
起

《代号:黑箱》 我们 Meshy Game Studio 的第一款产品,通过我们自研的 “AI 游戏机制大模型” 合成武器,每一局都有完全不同的玩法,上图的攻击技能是玩家的创意自由合成出来的。我们期待他是市场上第一款真正好玩的 AI 原生游戏,很开心今天能和大家分享一下这款游戏背后的故事。
时间回到 2014 年前,我在清华读大二。受当年大火的游戏 《2048》 启发,我做了一款数字消除游戏,《Not a Number》。当年在人人网火了一波,一周之内吸引了近 20000 人来玩。在清华上课的时候发现周围的同学没人听教授讲课,都在玩自己做的游戏,那成就感叫一个强 :-) 后来 NOI 2014 喊我去出题,我就出了一道《消除游戏》,不知道读者朋友有没有还记得这个游戏或者这个题的。



从姚班毕业后,我去 MIT 继续攻读计算机图形学博士,毕业以后做了 Meshy AI,现在是 3D AI 全球市场份额第一位的产品。干 CEO 干累了,有的时候就想回归初心。我一开始为什么学编程?为什么搞图形学?
为了做游戏。
创业蛮苦的,好在公司还比较成功,未来有无限可能。不管走多远,我都知道有一天我会重新回到初心,去做一件小时候的我最想做的事情:做一款游戏。恰好 Meshy 又是一家 AI 公司,我们在一个非常好的时间点去做一款 AI 原生的游戏。

1
AI 目前真的让游戏变得更好玩了吗?
先来简要总结一下目前 AI 和游戏结合的已有工作。我们没有走这些路线,但是这些工作毫无疑问会启发很多后人。
基于 real-time video model(不管是 diffusion 还是 autoregressive),也就是 Genie 3 的 “世界模型路线”。我花了 $200 去玩了 Genie 3,发现几个问题:这个产品基本上是一个风景模拟器,但是一个好玩的游戏有机制、美学、剧情等等成分,只能看看风景是不够有意思的。如果大家对“世界模型”感兴趣,请移步《硅谷 101》最新一期节目,节目组邀请我发表了一些看法:全面解析“世界模型”:定义、路线、实践与AGI的更近一步 AI 对话。Character.ai 类似的应用就是典型的例子,相当于把游戏里面和 NPC 互动功能单独抽出来做成一个互动产品。直到今天,Character.ai 依然有着巨大的流量,不过我自己恐怕不是这个方案的受众。 AI 生成图片或者 3D 模型进行换装、UGC。我们也和合作伙伴合作过这个事情。把 Meshy API 接入游戏中,允许玩家生成自己的武器、装备的形象。最后数据跑下来发现玩家只是被广告里面的 AI 两个词吸引了,也许短暂能观察到投放转化率的提升,但是由于简单的 AI 生成素材换皮这事儿其实并不 “好玩”,甚至大部分玩家连提示词都想不出来,很快玩家就流失了,留存率不变甚至变低了,ROI 算不清楚。也许乙女向的游戏里面有一些本方向的机会,可惜我不是受众。 AI 一键生成游戏,代表产品如 Rosebud AI,本质上是 “vibe coding for games”,也能做出一些用户量。但是平台上的游戏普遍目前质量不高,暂时难以达到一个游戏原型应该有的标准。 AI 小镇。以斯坦福小镇为起点,让 NPC 更加有烟火气。但是我作为一个玩家,总觉得参与度有些低。 AI 生成剧情,最近有不少小成本的成功产品出现,也是很不错的方向。
1
如何破局
抛开我们自己是否爱玩,还有一个问题要回答:无数人按照上面的路径尝试了 AI 和 游戏结合,为什么还没有真正现象级的产品?
也许原因有很多。我们的分析思路是回归第一性原理:对于绝大多数游戏来说,成功的关键只有一点,“好玩”。游戏要好玩才能会有人玩。而已有的 AI + 游戏尝试,本质上并没有让游戏变得更好玩。
如果要破局,能否换一个思路,从游戏本身出发,反过来思考:游戏本质上是因为什么好玩?而 AI 能对加强这个本质,做出什么贡献呢?
要回答这个两问题,我们来看两款我自己非常喜欢的游戏:Jonathan Blow(吹哥)的 《Braid 时空幻境》和《塞尔达传说:旷野之息》 (Botw)。这两款游戏分别是非常成功的独立游戏和大制作。




我们可以看到,在顶尖游戏开发者眼中,刨去画面表现,游戏的内核是这些在原型中依然存在的机制与玩法,比如“按 Shift 键时间倒流”,比如“我砍树,树就会倒下,还会随着河水漂流”。
对于大多数没有大成的游戏,真正的问题恐怕并不是画面不够绚丽、对话不够生动,而是没有趣味,不好玩。就好像你开了个餐馆,名字好、地段好、装修好、广告好,但是菜不好吃,也许能赚点钱,但是一定不能成为顶级的餐馆。当然,其他成分也是游戏成功的重要成分,但是仅仅有优秀的美术、音乐、剧情是不行的。
游戏玩法(Gameplay)和游戏机制(Game mechanics)才是大多数游戏最本质的内容。如果 AI 原生游戏真的想有增量价值,不是为了用 AI 而用,就必须让 AI 实现玩法或者机制的生成。
注:游戏玩法(Gameplay)和游戏机制(Game mechanics)两个 terms 经常被混用,行业里也没有统一的定义。我们这里不泾渭分明地区分两个术语,而是将最核心的游戏机制定义为“玩法”。
但是要生成游戏机制,谈何容易!目前市面上很多游戏都只是在 “使用 AI 生成素材”,而不是 “由 AI 构成游戏机制本身”,是有原因的。
既然 “生成玩法和机制” 这个事情已经足够难,游戏行业又是一个存在了几十年、我们得保持敬畏的行业,我们就必须专注于解决核心问题,暂时放弃对其他方向的追求(比如 AI 生成环境、场景、NPC 等等)。
综上,第一款游戏,我们能且只能做 “AI 生成游戏机制” 这件事情。
1
站在巨人的肩膀上
既然决定专注研究游戏机制生成了,就得找一些以玩法见长的游戏。有哪些画面和剧情算不上顶尖,但是就是很好玩的游戏?我们从四个游戏中得到了启发:
暗黑破坏神 2。和我一样上了年纪的读者估计小时候玩过《暗黑破坏神 2》。小时候到外公外婆家一定要到小房间打开电脑玩上一小时。虽然从来没那个时间玩通关,但是能够体验一把死灵法师、德鲁伊、女巫在旷野中砍怪的爽快感,也对第一次看到安姐吓破胆的经历记忆犹新。尽管如此,我还是觉得当年玩《暗黑 2》有几个遗憾:
“技能树为什么是固定的?我想能做到言出法随!”
“要是我发出去的冰锥能够追踪就好了!最好击中以后再来个 AOE!”
“要是我召唤的骷髅怪,还能再召唤小怪就好了!”

Noita. 第一次看到这个法术编程模拟器游戏的时候我还在 MIT 读 PhD,深入玩已经是几年以后的事情了。开局一根杖,通过“法术编程”,搓出机关枪甚至核弹、黑洞,其乐无穷。


Noita 什么都好,只有两个问题:
1. 我作为一个 MIT CS PhD 要花十个小时才能初步入门《Noita 施法指南》,必须上 B 站看教程。
2. 太容易死了,前期极其劝退。我最后在打了十几个 mod 以后,终于顺利通关了。

吸血鬼幸存者。一次和一位好朋友爬山,他推荐了我这个游戏。后来他去了马斯克的 xAI,每天忙得要死,再也没有时间陪我爬山了,但是他推荐的吸血鬼幸存者一直陪伴着我。《吸血鬼幸存者》是“类幸存者”游戏的鼻祖,画面算不上最吸引人,但是游戏性极强。如果游戏里面的武器能够再丰富一些、合成能够更自由一些,就好了!

塞尔达传说:王国之泪 (Totk)这个作品我相信不用多说。具体聊一下“余料建造”:把蝙蝠眼睛合成到箭上,就能实现“追踪箭”。青沼大叔演示到这一步的时候,我想很多人都会觉得很惊喜、很想玩。(我最近硬件升级了 Switch 2,老存档丢了,只好从头开始玩。但是还是好好玩。)


“余料建造” 有了一定的自由度,但是还不够,依然还是按照写死的规则。为什么还要去查攻略看合成表呢?为什么就不能把任意两个道具合成?
1
AI 机制生成大模型
游戏的机制有不同的层面。按照如今 AI 的能力,自动设计出来一个 PUBG、搜打撤这种完全创新的宏观上的玩法,暂时是不太可能了,因为没有相应的训练数据。但是是否可以在大的玩法框架下(比如说 ARPG 打怪刷宝练级),做一些局部游戏机制的生成?
沿着这个思路就会发现,在上面四个游戏中,每一把武器、每一个职业、每一个技能,都是一个不同的攻击方式,都是游戏机制。比如要过河,野蛮人可以用斧子把旁边的树砍倒做一个独木舟,法师可以施展暴风雪把河面冻住,召唤师可以召唤一只河马宝宝驮我过去。能做到这个粒度的机制生成,其实就足够有趣了!
上面的几款游戏都以某种 build 机制为核心,实现了一定程度的游戏机制自由组合。但这几款我心中的神作里面的 build 机制还有如下的问题:
不够自由:比如在暗黑类游戏中玩家必须按照既定的技能树发展。虽然有一定 build 的自由度,但是 build 的规则依然是写死的,不能进行无限自由的操作。 不够直观:Build 的结果应该符合直觉。比如《吸血鬼幸存者》中的武器合成,我其实很难预判两个武器合成以后会成为什么样的新武器,这会大大降低我对游戏的掌控感。 门槛过高:Noita 就是典型的代表,如果一个 PhD 都要花十个小时才能上手,那么不太硬核的玩家大概率就和其中的乐趣说再见了。
自由、直观、低门槛三点相互制约。比如,“直观” 和 “低门槛” 这两点 Botw 和 Totk 已经做得很好了,但是其中的 “余料建造” 仅限于一些最简单的功能附加,比如附加个追踪、混乱等等,并不能通过一通精妙的合成实现一把惊天地泣鬼神的武器,于是自由度就上不去。另一个极端,Noita 在法杖编程的自由度上迈出了一大步,但是其不直观度和高门槛,又将很多玩家拒之门外。

当然,如果朝着 PoE 的方向做,也是一条路... 上图是 PoE 的技能树。要设计这样的技能体系出来本身也是成本极高的事情。(如果上面技能树图在手机上看不清,别怪我,要的就是这个效果。)
既然前面的作品里面的 build 系统已经做得很棒了,至少三点中占了一点或者两点。AI 要能做出增量价值,就只能 “自由、直观、低门槛” 三者全部做到。这是我们唯一的机会。
好在我们在做 Meshy AI 的过程中,掌握了 “多模态大模型训练” 这一异能。如果我们能够有效建立一套 “游戏机制数据集”,理论上就可以训练模型输出无穷无尽的机制,让玩家每次玩游戏都是一个新体验。
这是一个疯狂的想法,太阳系里面应该还没有人实现这样的事情。我们付诸了实践。经过一段时间的“炼丹”,终于得到了驱动我们的 AI 原生游戏的核心:“AI 游戏机制生成大模型”。
1
言出法随!
(此处省略一万字复杂的技术细节,以后有机会再分享吧...)
“丹” 炼好了以后,我们很快发现,最基本的 “言出法随” 已经可以实现。比如,你可以召唤一群爆破无人机:

或者生成一把激光枪:




自由:任何输入 AI 都能给你捣鼓出点东西,而且往往有些惊喜(“意料之外”) 直观:由于大模型用自然语言训练,模型自带很多常识,生成出来的东西又不会太离谱(“情理之中”) 门槛低:不需要学习《高阶法杖编程指南》,谁都可以玩(“老少皆宜”)
1
《代号:黑箱》







1
AI 原生游戏是未来最重要的事

农业时代,咱每天都得种田,不然就得饿死,那生存压力叫一个大; 工业革命以后,19 世纪早期,大家常见工作14–16 小时/天、每周 6-7 天; 工业革命后期,1926 年福特汽车在美国率先推行每天 8 小时、每周五天的 40 小时工作制; 今天某些欧洲国家已经在推行每周 < 40 小时的工作制。

1
加入我们
相信你一定对 AI 游戏这个话题足够热爱,才会看到这里。我们是一支刚刚成立、技术扎实、又非常务实的团队。《黑箱》也还有很多没解决的问题,比如:
平衡性、心流曲线 特效、粒子系统的优化 美术、特效、打击感(战斗策划)优化 扩大AI生成的范围(怪物,地形,关卡目标等等) 多模态 AI 引擎的继续研发 (任何你想参与的方向!)

