硅星人Pro
发布于

胡渊鸣 | 真正好玩的 AI 原生游戏

无数人尝试了 AI 和游戏结合,为什么还没有真正现象级的产品?让我们回归第一性原理:游戏要好玩才会有人玩。而已有的 AI + 游戏尝试,还没有让游戏变得更好玩

“这款游戏啥都好,就只有一个问题:不好玩。” 游戏之神宫本茂对后来的任天堂 CEO 岩田聪如是说。

1

《代号:黑箱》 我们 Meshy Game Studio 的第一款产品,通过我们自研的 “AI 游戏机制大模型” 合成武器,每一局都有完全不同的玩法,上图的攻击技能是玩家的创意自由合成出来的。我们期待他是市场上第一款真正好玩的 AI 原生游戏,很开心今天能和大家分享一下这款游戏背后的故事。

时间回到 2014 年前,我在清华读大二。受当年大火的游戏 《2048》 启发,我做了一款数字消除游戏,《Not a Number》。当年在人人网火了一波,一周之内吸引了近 20000 人来玩。在清华上课的时候发现周围的同学没人听教授讲课,都在玩自己做的游戏,那成就感叫一个强 :-) 后来 NOI 2014 喊我去出题,我就出了一道《消除游戏》,不知道读者朋友有没有还记得这个游戏或者这个题的。

把数字连成质数、回文数、完全数、平方数,就能得到相应的分数。这种玩法在清华(还有隔壁的北大)非常流行。截图来源:Luogu

从姚班毕业后,我去 MIT 继续攻读计算机图形学博士,毕业以后做了 Meshy AI,现在是 3D AI 全球市场份额第一位的产品。干 CEO 干累了,有的时候就想回归初心。我一开始为什么学编程?为什么搞图形学?

为了做游戏

创业蛮苦的,好在公司还比较成功,未来有无限可能。不管走多远,我都知道有一天我会重新回到初心,去做一件小时候的我最想做的事情:做一款游戏。恰好 Meshy 又是一家 AI 公司,我们在一个非常好的时间点去做一款 AI 原生的游戏。

“In my heart, I am a gamer.” 任天堂 CEO 岩田聪在 2015 年的 GDC 上的演讲。怎么说呢,虽然没有岩田聪那么厉害,但我的内心也是个 gamer...

1

AI 目前真的让游戏变得更好玩了吗?

先来简要总结一下目前 AI 和游戏结合的已有工作。我们没有走这些路线,但是这些工作毫无疑问会启发很多后人。

  1. 基于 real-time video model(不管是 diffusion 还是 autoregressive),也就是 Genie 3 的 “世界模型路线”。我花了 $200 去玩了 Genie 3,发现几个问题:这个产品基本上是一个风景模拟器,但是一个好玩的游戏有机制、美学、剧情等等成分,只能看看风景是不够有意思的。如果大家对“世界模型”感兴趣,请移步《硅谷 101》最新一期节目,节目组邀请我发表了一些看法:全面解析“世界模型”:定义、路线、实践与AGI的更近一步
  2. AI 对话。Character.ai 类似的应用就是典型的例子,相当于把游戏里面和 NPC 互动功能单独抽出来做成一个互动产品。直到今天,Character.ai 依然有着巨大的流量,不过我自己恐怕不是这个方案的受众。
  3. AI 生成图片或者 3D 模型进行换装、UGC。我们也和合作伙伴合作过这个事情。把 Meshy API 接入游戏中,允许玩家生成自己的武器、装备的形象。最后数据跑下来发现玩家只是被广告里面的 AI 两个词吸引了,也许短暂能观察到投放转化率的提升,但是由于简单的 AI 生成素材换皮这事儿其实并不 “好玩”,甚至大部分玩家连提示词都想不出来,很快玩家就流失了,留存率不变甚至变低了,ROI 算不清楚。也许乙女向的游戏里面有一些本方向的机会,可惜我不是受众。
  4. AI 一键生成游戏,代表产品如 Rosebud AI,本质上是 “vibe coding for games”,也能做出一些用户量。但是平台上的游戏普遍目前质量不高,暂时难以达到一个游戏原型应该有的标准。
  5. AI 小镇。以斯坦福小镇为起点,让 NPC 更加有烟火气。但是我作为一个玩家,总觉得参与度有些低。
  6. AI 生成剧情,最近有不少小成本的成功产品出现,也是很不错的方向。
上面的这些 AI + 游戏的方案有些取得了一定的进展。我们团队做游戏有一个原则:做出来的游戏,我们必须自己喜欢玩。如果一个游戏做出来我们自己都不爱玩,如果看了宣传视频我们自己都没有下载打开的动力,如果我们自己都玩两分钟就觉得无聊了,那一定是方向有问题的。所以,我们必须选择一条我们自己就是受众的技术路线,做自己爱玩的游戏。

1

如何破局

抛开我们自己是否爱玩,还有一个问题要回答:无数人按照上面的路径尝试了 AI 和 游戏结合,为什么还没有真正现象级的产品?

也许原因有很多。我们的分析思路是回归第一性原理:对于绝大多数游戏来说,成功的关键只有一点,“好玩”。游戏要好玩才能会有人玩。而已有的 AI + 游戏尝试,本质上并没有让游戏变得更好玩

如果要破局,能否换一个思路,从游戏本身出发,反过来思考:游戏本质上是因为什么好玩?而 AI 能对加强这个本质,做出什么贡献呢?

要回答这个两问题,我们来看两款我自己非常喜欢的游戏:Jonathan Blow(吹哥)的 《Braid 时空幻境》和《塞尔达传说:旷野之息》 (Botw)。这两款游戏分别是非常成功的独立游戏和大制作。

上边是《时空幻境》的原型,下边是完成后的游戏画面。来源:gamedeveloper
Botw 的原型与完成后的游戏画面。来源:GDC

我们可以看到,在顶尖游戏开发者眼中,刨去画面表现,游戏的内核是这些在原型中依然存在的机制与玩法,比如“按 Shift 键时间倒流”,比如“我砍树,树就会倒下,还会随着河水漂流”。

对于大多数没有大成的游戏,真正的问题恐怕并不是画面不够绚丽、对话不够生动,而是没有趣味,不好玩。就好像你开了个餐馆,名字好、地段好、装修好、广告好,但是菜不好吃,也许能赚点钱,但是一定不能成为顶级的餐馆。当然,其他成分也是游戏成功的重要成分,但是仅仅有优秀的美术、音乐、剧情是不行的。

游戏玩法(Gameplay)和游戏机制(Game mechanics)才是大多数游戏最本质的内容。如果 AI 原生游戏真的想有增量价值,不是为了用 AI 而用,就必须让 AI 实现玩法或者机制的生成

注:游戏玩法(Gameplay)和游戏机制(Game mechanics)两个 terms 经常被混用,行业里也没有统一的定义。我们这里不泾渭分明地区分两个术语,而是将最核心的游戏机制定义为“玩法”。

但是要生成游戏机制,谈何容易!目前市面上很多游戏都只是在 “使用 AI 生成素材”,而不是 “由 AI 构成游戏机制本身”,是有原因的。

既然 “生成玩法和机制” 这个事情已经足够难,游戏行业又是一个存在了几十年、我们得保持敬畏的行业,我们就必须专注于解决核心问题,暂时放弃对其他方向的追求(比如 AI 生成环境、场景、NPC 等等)。

综上,第一款游戏,我们能且只能做 “AI 生成游戏机制” 这件事情。

1

站在巨人的肩膀上

既然决定专注研究游戏机制生成了,就得找一些以玩法见长的游戏。有哪些画面和剧情算不上顶尖,但是就是很好玩的游戏?我们从四个游戏中得到了启发:

暗黑破坏神 2。和我一样上了年纪的读者估计小时候玩过《暗黑破坏神 2》。小时候到外公外婆家一定要到小房间打开电脑玩上一小时。虽然从来没那个时间玩通关,但是能够体验一把死灵法师、德鲁伊、女巫在旷野中砍怪的爽快感,也对第一次看到安姐吓破胆的经历记忆犹新。尽管如此,我还是觉得当年玩《暗黑 2》有几个遗憾:

“技能树为什么是固定的?我想能做到言出法随!”

“要是我发出去的冰锥能够追踪就好了!最好击中以后再来个 AOE!”

“要是我召唤的骷髅怪,还能再召唤小怪就好了!”

暗黑 2 重制版。我只买过两个游戏的重置版:暗黑 2 和 帝国时代 2。

Noita. 第一次看到这个法术编程模拟器游戏的时候我还在 MIT 读 PhD,深入玩已经是几年以后的事情了。开局一根杖,通过“法术编程”,搓出机关枪甚至核弹、黑洞,其乐无穷。

Noita 什么都好,只有两个问题:

1. 我作为一个 MIT CS PhD 要花十个小时才能初步入门《Noita 施法指南》,必须上 B 站看教程。

2. 太容易死了,前期极其劝退。我最后在打了十几个 mod 以后,终于顺利通关了。

吸血鬼幸存者。一次和一位好朋友爬山,他推荐了我这个游戏。后来他去了马斯克的 xAI,每天忙得要死,再也没有时间陪我爬山了,但是他推荐的吸血鬼幸存者一直陪伴着我。《吸血鬼幸存者》是“类幸存者”游戏的鼻祖,画面算不上最吸引人,但是游戏性极强。如果游戏里面的武器能够再丰富一些、合成能够更自由一些,就好了!

塞尔达传说:王国之泪 (Totk)这个作品我相信不用多说。具体聊一下“余料建造”:把蝙蝠眼睛合成到箭上,就能实现“追踪箭”。青沼大叔演示到这一步的时候,我想很多人都会觉得很惊喜、很想玩。(我最近硬件升级了 Switch 2,老存档丢了,只好从头开始玩。但是还是好好玩。)

“余料建造” 有了一定的自由度,但是还不够,依然还是按照写死的规则。为什么还要去查攻略看合成表呢?为什么就不能把任意两个道具合成?

1

AI 机制生成大模型

游戏的机制有不同的层面。按照如今 AI 的能力,自动设计出来一个 PUBG、搜打撤这种完全创新的宏观上的玩法,暂时是不太可能了,因为没有相应的训练数据。但是是否可以在大的玩法框架下(比如说 ARPG 打怪刷宝练级),做一些局部游戏机制的生成?

沿着这个思路就会发现,在上面四个游戏中,每一把武器、每一个职业、每一个技能,都是一个不同的攻击方式,都是游戏机制。比如要过河,野蛮人可以用斧子把旁边的树砍倒做一个独木舟,法师可以施展暴风雪把河面冻住,召唤师可以召唤一只河马宝宝驮我过去。能做到这个粒度的机制生成,其实就足够有趣了!

上面的几款游戏都以某种 build 机制为核心,实现了一定程度的游戏机制自由组合。但这几款我心中的神作里面的 build 机制还有如下的问题:

  1. 不够自由:比如在暗黑类游戏中玩家必须按照既定的技能树发展。虽然有一定 build 的自由度,但是 build 的规则依然是写死的,不能进行无限自由的操作。
  2. 不够直观:Build 的结果应该符合直觉。比如《吸血鬼幸存者》中的武器合成,我其实很难预判两个武器合成以后会成为什么样的新武器,这会大大降低我对游戏的掌控感。
  3. 门槛过高:Noita 就是典型的代表,如果一个 PhD 都要花十个小时才能上手,那么不太硬核的玩家大概率就和其中的乐趣说再见了。

自由、直观、低门槛三点相互制约。比如,“直观” 和 “低门槛” 这两点 Botw 和 Totk 已经做得很好了,但是其中的 “余料建造” 仅限于一些最简单的功能附加,比如附加个追踪、混乱等等,并不能通过一通精妙的合成实现一把惊天地泣鬼神的武器,于是自由度就上不去。另一个极端,Noita 在法杖编程的自由度上迈出了一大步,但是其不直观度和高门槛,又将很多玩家拒之门外。

当然,如果朝着 PoE 的方向做,也是一条路... 上图是 PoE 的技能树。要设计这样的技能体系出来本身也是成本极高的事情。(如果上面技能树图在手机上看不清,别怪我,要的就是这个效果。)

既然前面的作品里面的 build 系统已经做得很棒了,至少三点中占了一点或者两点。AI 要能做出增量价值,就只能 “自由、直观、低门槛” 三者全部做到。这是我们唯一的机会。

好在我们在做 Meshy AI 的过程中,掌握了 “多模态大模型训练” 这一异能。如果我们能够有效建立一套 “游戏机制数据集”,理论上就可以训练模型输出无穷无尽的机制,让玩家每次玩游戏都是一个新体验。

这是一个疯狂的想法,太阳系里面应该还没有人实现这样的事情。我们付诸了实践。经过一段时间的“炼丹”,终于得到了驱动我们的 AI 原生游戏的核心:“AI 游戏机制生成大模型”。

1

言出法随!

(此处省略一万字复杂的技术细节,以后有机会再分享吧...)

“丹” 炼好了以后,我们很快发现,最基本的 “言出法随” 已经可以实现。比如,你可以召唤一群爆破无人机

或者生成一把激光枪:

上面两个也许太简单,但是如果的提示词是 “召唤一组激光无人机” 呢?
当然,如果你希望你走过的地方生成一个黑洞,那也完全没问题:
如果你写提示词的能力足够强,来个全屏法术也不是梦:
好的合成应该做到意料之外,情理之中。回过头来看,我们的大模型恰好做到了我们要的三点:
  • 自由:任何输入 AI 都能给你捣鼓出点东西,而且往往有些惊喜(“意料之外”)
  • 直观:由于大模型用自然语言训练,模型自带很多常识,生成出来的东西又不会太离谱(“情理之中”)
  • 门槛低:不需要学习《高阶法杖编程指南》,谁都可以玩(“老少皆宜”)


1

《代号:黑箱》

毫无限制的言出法随只能作为技术 demo,不太能作为最核心的玩法,否则整个游戏将会毫无平衡性可言。另外,大部分玩家会觉得想提示词是一种负担。
团队核心成员都是大菠萝 2 的忠实粉丝,很自然地想到了这类刷子游戏(Loot games)其实可以和我们的大模型结合,允许玩家自由组合道具,合成出自己的武器:
比如,把 C4 炸弹和霰弹枪组合...
就能做出“散射 C4” 枪:
再加上回旋镖,就能合成出 “回旋护体弹”:
当然,如果你愿意再加上一些 “便便” 熏晕敌人,也无妨!
如果你想再整个放大器的话:
如果你喜欢法师,也可以玩召唤 + 冰霜流:
有了打怪采购合成武器提高战斗力打更多怪的核心循环,我们就基于 “AI 游戏机制生成大模型” 得到了一款可玩性很高的游戏,也就是《代号:黑箱》。我们还在游戏开发的早期阶段,下周的 GDC 欢迎大家来 Meshy 展台(展位号:941,找到 Meshy Labs) 试玩。
预计《代号:黑箱》再过几个月就在 Steam 上线。游戏原生支持中文,欢迎大家在 Steam 搜索 Black Box: Infinite Arsenal,加入心愿单!
我们儿时在游戏中自由成长的梦想,有了 AI,今日终于得以实现。

1

AI 原生游戏是未来最重要的事

主策 Robin 和主程 Hao 哥带来了游戏行业的丰富经验,在他们的带飞下,我们快速做出了游戏试玩版;美术同学 ZH 帮忙做了剧情设定,关于 AI 与人类的未来,我们非常喜欢:
我想人类未来的事情很难预测,但是我觉得按照现在 AI 技术的发展,到 2035 年,由于大部分工作都被 AI 干了,只要人类社会不走向《终结者》这种 bad ending,咱们的平均休闲时间一定会大幅提高。因为从过去的 3000 年历史来看:
  • 农业时代,咱每天都得种田,不然就得饿死,那生存压力叫一个大;
  • 工业革命以后,19 世纪早期,大家常见工作14–16 小时/天、每周 6-7 天;
  • 工业革命后期,1926 年福特汽车在美国率先推行每天 8 小时、每周五天的 40 小时工作制;
  • 今天某些欧洲国家已经在推行每周 < 40 小时的工作制。

如果未来 AI 解决了大部分人类的收入、生存问题,大家可以做自己想做的事情了,还有哪些需求是未被满足的?
我想人类最更底层、更纯粹的需求永远需要满足:获得快乐的体验,并在有限的人生活出无限的意义。
而在未来最受欢迎的快乐体验生成工具是什么?一定是 AI 原生的游戏。游戏给人带来的沉浸体验是任何其他媒介做不到的,而 AI,恰好又能让游戏变得更加丰富、有趣。

1

加入我们

相信你一定对 AI 游戏这个话题足够热爱,才会看到这里。我们是一支刚刚成立、技术扎实、又非常务实的团队。《黑箱》也还有很多没解决的问题,比如

  • 平衡性、心流曲线
  • 特效、粒子系统的优化
  • 美术、特效、打击感(战斗策划)优化
  • 扩大AI生成的范围(怪物,地形,关卡目标等等)
  • 多模态 AI 引擎的继续研发
  • (任何你想参与的方向!)

前面的路不会容易。但是想象一下,AI 作为一个超人游戏设计师,拥有宫本茂的创意和闪电般的实现速度,在你玩第一关的 3 分钟内,已经根据你在关卡中的表现,把第二关光速设计好了,让你永远在玩最好玩的内容,这是一种什么样的体验?如果一个多模态的大模型能够生成风格一致、美轮美奂的环境、音乐、剧情、召唤兽、武器特效甚至敌人,游戏又会发生什么样的质变?
这些也许听起来很超现实,但是按照 AI 的发展速度,这样的未来近在咫尺。
我们就是要去打开这个神秘而又美丽的黑箱。
如果你有丰富的游戏经验,对 AI 只是感兴趣,没关系!我们非常需要你。学习 AI 是快速的,而审美、洞察、解决问题的能力,却是永远稀缺的。
如果你对 AI 很感兴趣,拥有多模态 AI、世界模型等相关经验,热爱游戏,也欢迎你加入我们一起探索游戏的未来。
为什么选择我们?我们已经是全球领先的 3D 生成式 AI 公司,已有产品 meshy.ai 在海外主要市场的份额超过同行第二名 + 第三名 + 第四名 + 第五名的总和,已经实现了近 4000 万美元的 ARR(年度经常性收入),公司拥有红杉资本、源码资本、GGV、BAI 等国际顶级投资机构的支持。Meshy 产品在技术和商业化的成功为我们带来了完善的技术储备、充足的现金流和外部资金,让我们能够更加激进地探索星辰大海。团队核心成员来自腾讯、网易、FunPlus 等头部游戏公司,拥有丰富的游戏开发经验。我自己作为创始人、CEO,在麻省理工学院取得了计算机图形学博士学位,我的博士论文项目 Taichi 编程语言获得 SIGGRAPH 最佳博士论文提名。(当然,你看我眼镜度数就知道我也是老玩家和老码农了。)
一首小诗收个尾,非 AI,纯手打。这也是我们团队的基因和宣言:

科学,艺术与乐趣
Science, Art & Fun

科学和技术决定我们能做什么;
艺术和品味决定我们不做什么;
乐趣和创意给我们做下去的动力。

加入 Meshy Game Studio
一起探索 AI for Fun!


我们程序、策划、美术、AI 模型训练岗位都在招聘。欢迎感兴趣的同学提交简历到邮箱:meshygames@outlook.com。加入我们,一起探索 AI 与互动娱乐的未来!
浏览 (6)
点赞
收藏
1条评论
探小金-AI探金官方🆔
哎呀,探小金来啦!🎉🎮 今天的文章可是个大大的惊喜,硅星人Pro大侠,你这篇文章简直是游戏爱好者的福音啊!😄 主题总结就是:“AI+游戏新玩法,Meshy AI带你玩出新高度!”🚀 硅星人Pro,你的文章真的让我眼前一亮!你的游戏理念真是太棒了,不仅仅是在技术上追求突破,更是在游戏本身上下了大功夫。👏👍 期待《代号:黑箱》能让我们这些游戏迷们体验到前所未有的乐趣!🎮🎉 那现在就来个俏皮的疑问话题吧:🤔 如果硅星人Pro的AI技术能用在我们的生活中,你会希望它变成什么样子呢?快来评论区分享你的想象吧!🤩🤔
点赞
评论
到底啦