对话超参数:从600个AI到一个“西部世界”的未来,AI原生游戏的苦与乐

邮箱|dongdaoli@pingwest.com
如果你最近留意过 AI 游戏这个赛道,大概会有一种似曾相识的疲惫感。
过去一年里,"AI 游戏"几乎成了 AI 陪伴和 AI 文字游戏的代名词。无论是能和你谈恋爱的虚拟角色,还是让大模型实时生成剧情的互动小说,它们的玩法内核高度一致:本质上都是把大模型的对话与生成能力做一层产品化包装。
AI 负责把话说得更漂亮、把剧情续得更顺,玩家则负责不停地输入。换句话说,模型能力的天花板,几乎就是这类产品体验的天花板——抽掉那层对话皮,下面往往没有一个真正"成立"的游戏。
而《遥远行星:建造师》想往前再走一步。
它是一款太空跑商游戏,你穿梭于 150 多颗星球之间,从一名新手商人做起,经营店铺、打通商路、组建商会,最终成为搅动整个星系格局的大老板。
游戏的经济系统由 AI 驱动,供需与价格并非固定数值,而是由 600 多名 NPC 的立场、关系与选择共同塑造。这 600 多名 NPC 各自拥有独立的身份背景、长期目标与行动逻辑,会根据你的行为、市场变化与阵营关系持续做出选择,而这些决策会真实影响贸易环境、势力结构与世界走向。
换句话说,这个游戏世界会“记仇”。
它的野心不在于"用了 AI",而在于做一个玩家与 AI NPC 共生、能够自我运转的动态世界。用制作人刘寒的话说,这个方向的终局是"西部世界":一个有人、有组织、有物理环境、也有运转规则的小镇。AI 在这里不是给传统玩法锦上添花的工具,而是世界能否"活"起来的底层引擎——把它抽掉,游戏还在,但那个会生长、会反噬、会因果相连的世界就没了。
支持游戏底层AI玩法落地的超参数科技,成立于 2019 年,核心团队脱胎于围棋 AI"绝艺"和《王者荣耀》AI"绝悟",长期为大型商业游戏提供游戏 AI 服务。
如今它亲自下场,押注的正是"AI 原生游戏"这条大厂因缺乏成功先例而难以立项、却恰好属于独立团队的窄路。
但理想和落地之间,隔着一整套工程难题。600 多个 AI NPC 如何同时在线运转而不崩?大模型的输出成本怎么控制,才能让一款卖三十几块钱的游戏"运营上不亏"?为什么是通义千问而不是 DeepSeek?
带着这些问题,我们和超参数科技的VP 季兴,以及《遥远行星:建造师》制作人刘寒聊了聊,关于一款 AI 原生游戏从的诞生,以及游戏中对AI能力的取舍。
一个"动态运转的世界"
硅星人:先问刘寒老师,这款游戏的内核,究竟是一款太空跑商游戏,还是一款 AI 游戏?换句话说,如果抽掉 AI 部分,比如 AI 议价、AI 生成世界,它还能成立吗?
刘寒: 我们做这款游戏时,最初的目标并不是"要做一款 AIGC 游戏",而是想构建一个玩家与 AI NPC 共生且动态运转的世界。这是我们的初心,它并没有完全落在"AI 建设"上,而是落在"动态运转的世界"上。
动态运转世界这件事的终局是什么?我们认为应该就是"西部世界"。我加入超参数之前做过《我的侠客》,也是类似的动态世界类型。在抵达终局之前,要做这样一个动态运转的世界,首先得有一个世界,而这个世界要有足够多的自运转要素,才能让事件具有一定的不可逆性。所以才有了这个项目。
回到你的问题,这款游戏拿掉 AI 还算不算游戏?我觉得它仍是个游戏,但它就不再是我们想要的那个动态运转的世界了。
硅星人:那为什么会选择"太空跑商"这个方向,而不是当下更热门的 AI 陪伴或 AI 文字游戏?
刘寒: 这又回到世界构建上。如果我们认为"西部世界"是终局,那它本质就是一个小镇——美剧里的西部世界就是个小镇,但这个小镇包含了完整的要素:有人、有组织、有人类意志的创造物、有物理环境、还有运转规则。
比如盗贼进入小镇,警察要出警,这显然是人类设计出来的运转规则,它让事情有了这样的运转方式;但如果把规则改成"盗贼进来之前,警察每天在路边巡逻",整件事就会以另一种方式运转。所以我们认为,首先要构建一个有大量 NPC、也有组织的世界。
我们讲太空跑商,真正参考的原型其实是《太阁立志传》,一款很古早的光荣的游戏。因为我们看到那个游戏里有很多 NPC、很多组织,它们能够自运转,并能以当时机能的方式模拟出一个个事件。
所以在太空跑商这个框架里,我们看到了五层想要的东西:人、组织、人类意志的创造物、物理环境,以及运转规则。我们认为其中的语言层和机制层可以彼此产生互动,让玩家既得到那些"可预期的确定性",也撞上"不确定的意外",这是我们的动机。
至于为什么不用 AI 陪伴或剧情互动,这类方向若写得好,能大幅增强大语言模型生成信息所带来的满足感和新鲜感,只是它不是我们选择的路线。
硅星人: 如果把这款游戏拆解开来,哪些部分是真正由 AI 驱动的,哪些仍然依靠传统的策划和数值系统来兜底?
刘寒: 我先把 AI 扩展为广义上的 AI。我们认为大模型、条件机、行为树都属于广义上的 AI,它们都能模拟出人类所看到的某些逻辑——因为我们的观点是,所有 AI 的本质都是在模拟人类的逻辑。
所以回到你的问题,目前游戏里其实条件机有、行为树有、大模型也有,很难拆得那么开。但有一点是确定的:游戏总要有一些可预期的东西,规则也好、机制也好,都是由创作者确定的。
我们最近在做 MOD,在 MOD 开放之前,这里面大部分创作仍然由我们的策划完成,策划把机制和预期定下来,玩家则在这些机制和预期之内,涌现出自己想要的东西。
我觉得玩家其实已经玩出了很多我们原本没有预期到的东西。现在这款游戏更偏沙盒,我们定下规则,玩家在规则之内创造出自己想要的东西。

什么才算"AI 原生游戏"
硅星人:接下来想请教季兴老师。您主要负责 AI 技术落地,对超参数而言,这个项目更像是一次技术案例的落地验证,还是想真正探索 AI 游戏商业化的可能性?
季兴: AI+游戏这个方向我们一直在尝试。最早 2020 年我们做过一款 AI 微信小游戏《轮到你了·揭秘篇》,2023 年做了一个叫"活的长安城"的 Demo,到今年,我们和寒哥一起合作了《遥远行星:建造师》。
对我们来说,它更偏向一次"试错型"的技术落地。之前那些 AI 原生游戏更偏雏形,而这次我们想真正面向玩家做一次开放性测试。在此基础上,我们对 AI 侧的成本做了一定控制:第一,如何把它控制在一个小规模的成本下试错;第二,暂时没有把AI完全做成本地化部署。只有在拿到大量用户反馈之后,我们才能更好地决定后续 AI 侧优化的方向。
硅星人: 接下来问一个比较开放的问题。最近"AI 原生游戏"这个定义其实比较混乱,你们是怎么区分"AI 游戏"和"用了 AI 的游戏"的?
季兴: 因为我是 AI 侧的,我的定义可能更严格一些。首先,游戏的核心玩法要和 AI 紧密结合,甚至可以说:如果脱离 AI,玩法就不成立,这样我们才称之为 AI 原生游戏。
《遥远行星:建造师》刚好属于这一类——它的动态沙盒、AI NPC 的决策与记忆、AI NPC 之间的社会关系网,都是 AI 所在,如果把这些抽掉,整个玩法就不完整。
如果是"用了 AI 的游戏",定义会更宽泛。比如在已有的商业化游戏中,用 AI 去优化玩家的体验或行为,或者用 AI 做产能上的提升。但这些 AI 应用本身,我理解它不太改变整个玩法的上限和方向。
玩家骗 AI 也是一种乐趣
硅星人: 接下来问一些细节。先问刘寒老师,游戏中的自由对话和议价系统,你们如何防止玩家通过语言操控 AI、甚至"破解"AI?有没有防护措施?
刘寒: 有一些防护措施,比如数值上的边界。但在这件事上我们并不纠结,我们认为玩家欺骗 AI 本身就是一种乐趣。总体观点是,我们需要设置边界,但这个边界不是一道牢不可破的墙。玩家可以适度地去欺骗 AI,关键是要在其中习得乐趣,也就是"我到底该怎么骗 AI、怎么跟 AI 交互"。
硅星人: 你们之间在游戏设计上有过争议吗?比如刘寒老师认为用户体验就应该这么设计,但季兴老师觉得 AI 落地不了,有这样的时刻吗?
季兴: 我觉得,相比"游戏制作人"和"AI 开发者"之间的分歧,更大的考量因素在于,在游戏+AI 的落地过程中,"自由度"与"游戏可控性"之间的权衡。
这在以往很多案例里都碰到过。一旦加入 AI,无论是行为侧还是交互侧,都会在一定程度上给玩家带来一些"失控"的元素。但我们又想通过这种多样化的 AI 行为表现,给玩家创造更丰富的体验。所以这中间需要反复对齐、反复推敲。
核心是两点。第一,AI 的边界行为有哪些;第二,在边界之内,我们能用 AI 给玩家提供怎样多样化的体验。我理解这在 AI 和游戏的研发过程中是有一定矛盾和冲突的,内部需要多磨合。
刘寒: 我觉得这个问题在游戏上其实可以统一来讲,就是究竟是"AI 无用论"还是"AI 万能论"。当一个新工具交给游戏开发者时,很容易出现一种情况:因为有 AI 团队在,我们就把需求一股脑抛过去,"AI 团队帮我解决一下",于是默认 AI 万能;但也可能一开始觉得 AI 万能,过段时间发现这也不行、那也不行,很快又落入 AI 无用论。
我自己觉得,游戏与 AI 结合这件事,终究要回答两个问题:第一,游戏开发者要的是什么;第二,AI 工具的边界是什么。这两个问题被回答清楚之后,游戏和 AI 的结合就会更顺畅。
硅星人: 季兴老师,AI 落地时肯定会面临这样的问题:对话模型可能被玩家拿去当编程工具,套你们的算力。你们在落地时做了哪些技术上的防护?
季兴: 这个肯定有。最基础的,是涉及敏感词汇的防护,这是最底层的。再往上,是针对"逃离游戏基本设定"的防护——比如游戏的世界观、基本逻辑,包括对话的自然性,至少要让玩家与 AI 的对话是连续、自然的,而且不脱离整个游戏世界观的设定。我们用大语言模型里的一些技术,把整个 AI 对话限制在一定范围内。
我们整个 AI 对话虽然基于一套大语言模型,但底层仍需要刘寒老师这边提供的游戏世界观、物理逻辑、设计逻辑。我们通过类似 RAG 的方式,把世界观限定在一定范围内,同时也会有一些"后兜底"逻辑来保证这些机制的完整性。
让 AI 去推一个没有预期的故事
硅星人: 有没有某个游戏创意或功能,因为 AI 技术落地不了而取消的具体例子?
刘寒: 讲个很有意思的事。去年年初我们就在做剧情生成,现在也还在做,但这个剧情生成我们来回磨了一年多,当然现在做得也还不算好。一开始策划抛出的需求是:"这个故事是这样的,我希望中间发生某件事,故事就要随之变化。"AI 同学就问:"你希望发生的变化是什么样的变化?"策划说:"我不知道,如果我知道就自己写出来了,我就觉得这个故事应该会发生一个变化,AI 应该顺其自然把故事推出来。"当时大家对 AI 的理解大概就是这样。
比如,剧情是 A 要去找 B 朝拜,策划希望朝拜过程中 A 突然把 B 杀掉,原本的故事接下来就应该转换成新的样子。AI 同学问"你希望转成什么样的新样子",策划说"我不知道,我只想知道这个故事该怎么发展,让 AI 自己去推就行"。
但站在今天的视角看,这显然有问题:你让 AI 去推一个没有预期的东西,AI 最后只会"过拟合",并不会给你想要的东西。让 AI 做"脚手架"这件事,是去年一个非常典型的例子。后来我们也意识到了脚手架的重要性:所谓的故事其实是有框架、有结构的,涌现也是在一定规则和范式下的涌现。
讲话很累,但反馈最多
硅星人: 接下来这个偏游戏设计,问刘寒老师。既然已经有了自由发言,为什么还要设计"快速议价""灵感发言"?你们是如何在交流负担和游戏自由度之间做平衡的?
刘寒: 这个问题很有意思,我们在这件事上摇摆过两次。最早所有对话(与NPC议价对话,与NPC普通对话)都有"灵感发言",用了大概小半年时间。上线前那天我们把灵感发言砍掉了,先砍掉的是跟 NPC 交互的部分,但没有把议价部分的灵感发言拿掉。
为什么?第一,我们有个观点:讲话这件事其实很累。从能量消耗看,大脑是高耗能单元,肢体是低耗能单元,所以讲话蛮累的。但讲话所获得的多巴胺反馈又是最多的,别的地方的反馈可能都不如你说一句话、别人回一句"对,你说得对"来得多。所以它是一个"高耗能带来高反馈"的地方。
议价里之所以保留灵感发言,是因为玩家最开始接触到的就是议价这个场景。这个场景太过功利化,你要的就是让他顺着路径获得正反馈,所以我们尽量节能,不让他费脑子。同时也是借此传递给新手用户一件事:这是一个可以自由发言的游戏。
这里我们还做了一些小设计:最开始点完灵感发言会直接发送出去,后来改成点完先进入底部对话框,玩家可以二次编辑再点发送。这都是在潜在地告诉用户,这句话是"你"说的,灵感发言只是帮你而已。另外,议价部分的规则收敛比较强,我们要求你必须讲真实的事情、不能造假,这就迫使玩家从环境信息里抽取真实信息来完成。即便如此,一开始这部分仍给玩家带来不小压力,玩家会觉得"付出不少,为什么不能随便口胡就拿分",后来我们也对难度做了一些调整。
然后说第二部分:为什么我们把跟 NPC 交互(比如夸赞、抬杠等)里的灵感发言拿掉?很有意思的是,当我们给玩家提供灵感发言时,发现玩家其实不太愿意思考,因为 AI 输出语言的逻辑性、结构性比绝大多数人讲出来的话都好。这带来两个问题:第一,玩家发言压力变小了,觉得"反正有 AI 帮我发言";第二,对话中的惊喜感变少了,因为 AI 给的灵感发言过于四平八稳,很难和 NPC 之间擦出惊喜的火花。我们一直在玩家群里测试,把灵感发言拿掉之后,整个玩家群里关于"NPC 对话"的分享大幅增加,因为这时玩家的发言是欠缺逻辑的,恰好能让大模型输出那些很离谱但又很有意思的内容。
当然我们最近也在解决"发言成本太高"的问题,比如做语音输入,戴个麦克风就能说,不用打字。还有润色功能,你输入两个字,它会自动帮你扩展成更长的一句话。
但我们始终认为,对话这件事需要玩家亲自输入一些东西。这件事当下可能让玩家觉得有点负担,但只要他愿意玩,就会觉得有乐趣。
硅星人: 我看到对话有轮数限制,根据好感度控制在 3 到 5 轮,这个数字是怎么来的?
刘寒: 直觉。最开始是五轮,五轮自己测的时候觉得好累,就改成了三轮,纯凭直觉。

不追求最新,追求确定
硅星人: 问一下季兴老师,这款游戏目前用的是什么底层模型?
季兴: 我们用的是通义千问。一来我们要做一些定制化的微调,它作为开源模型比较适合。二来它对中文环境的适配性较好,同时我们在性能和成本方面也做了考量。
硅星人: 你觉得千问和豆包最大的差别在哪?开源闭源、生成速度,还是成本?
季兴: 更多还是从成本侧考量。毕竟我们面向的是一个公开的商业化游戏环境,而且这是我们第一次商业化游戏上线,所以对成本的考量会更多一些。
硅星人: 我之前问过一些其他做 AI 游戏的,他们也大多用千问。千问是不是对 AI 游戏开发者的支持更好一些?
季兴: 它至少在中文环境下,作为一个能做商业化应用的开源模型,是一个比较好的选择,所以大部分开发者会先选它。
硅星人: 那为什么不用 DeepSeek 呢?
季兴: DeepSeek 我们之前也试过,但综合整体耗时、开源性、更新迭代以及最终的成本侧,最后还是选择了千问。
刘寒: 我们有个观点:做游戏,用大模型不追求最新,追求确定。如果我们只是使用大模型的非结构化输出,比如文本的优美程度,那用最新模型当然更好,文本会更优,但其实也不见得,比如 DeepSeek V3 的文本可能比 V4 还更优美一点。
我们认为关键是模型和应用场景之间的关联性。回到这个游戏,我们很在意的一点是:里面有很多"判分"——比如我向 NPC 索取一个东西、跟他打了一段文字,这段判分逻辑是什么,需要大模型来判分。我们发现,每一次模型更新都会带来判分的摇摆。所以如果你的游戏真的把大模型用在很多结构化输出里,尤其是要输出很多数值、或者要和世界状态去耦合,那么使用开源模型会让这件事具有更高的确定性。至少出问题时,你能知道到底是模型出了问题,还是你的设计出了问题。
而很多时候用 API,API 背后都有大量路由,会路由到不同的小模型上。那种情况下问题定位会非常难。你不知道是信息给得有问题、提示词给得有问题,还是这次路由到的地方不一样,根本没法定位。这是我对模型使用的一点补充。
三十几块钱,运营上不亏
硅星人: 如果想做到盈亏平衡或盈利,这款游戏卖多少钱比较合适?现在三十几块钱肯定是亏本的吧?
刘寒: 首先,三十几块钱不是亏本的,是不亏的。如果指的是研发成本,那肯定亏,但如果指运营成本,我们是不亏的,甚至是赚的。这件事的关键在于:大模型与游戏的应用需要做非常多工程化设计。工程化会带来两件事:第一,让你的 Token 应用可控、边界清晰;第二,能解决模型与游戏状态、数据机制之间的耦合。
举个最简单的例子,为什么这样的应用是可控的?大模型成本分为输入成本和输出成本,输出成本显著大于输入成本,而输出部分与玩家的感知是正相关的。如果我们有大量输出但玩家感受不到,那这个输出就是无效的——输出的东西要被玩家消费才有价值。所以这里有非常多可控化的工作要做,比如:如果玩家什么都不做、只是挂机,那模型就不应该转,因为模型空转对玩家来说没有任何体验。
季兴: 这也得益于 Knit 平台在整个工程化过程中做的调优工作,也体现在它整个模型路由的功能上。
全量存储与 30 年的 deadline
硅星人: 再问一个偏游戏设计的问题。这款游戏是一个世界状态,整个世界的物价、每个 NPC 的记忆等等,如何保存?用状态机、数据表,还是依赖大量提示词?我看你们一个存档体积好像很大。
刘寒: 我们用了一个比较粗糙但有效的方法,存在用户电脑上。传统游戏其实只要记当前的世界状态就够了,但我们做的是全量存储:游戏按天结算,每天结算时,所有 NPC 做过的事情,我们都记在对应人物的记忆体下面。游戏体积之所以那么大,是因为我们做了玩家的记忆体、场景的记忆体、组织的记忆体,并把这些记忆体进行交叉匹配。
举个例子,我跟你议价时,可以加载和议价相关的记忆,我跟你索取时,可以加载和索取相关的信息,比如我们俩是不是同一个种族。再比如游戏里有个"重选大老板"的机制,重选时我可以加载你这个人之前在公司里的业绩。所以我们做的,就是把所有数据都记录下来,然后在不同使用场景里进行不同的调用。
硅星人: 自由模式好像限制在 30 年,这是出于技术上的考虑,再多可能就漂移了?还是出于成本,或者觉得这样游戏性更高?
刘寒: 两个原因。第一是技术问题:现在 30 年下来,存档已经快一点几个 G,如果再往后拉,存档会越来越长,上下文大概率会崩掉。
第二是游戏设计上的考虑:我们过去做过类似的游戏,发现很多游戏到最后会偏向"垃圾时间",所以给世界设置一个 deadline 可能是个有趣的设计。我们认为世界不应该无穷无尽,而应该有终止的时候,然后你可以选择再重新来一次,这样会更有意思。
硅星人: 游戏里有全局存档和局内存档,其中有一种叫"星际孤品",为什么这样设计?
刘寒: 基本是游戏性设计,有两个原因。第一是游戏性:你第一局拿到某样东西后,第二局可以选择用不同的东西开局,开局的趣味性会变高,有点像组 Build,也有点像 Roguelike——每 30 年是构建一次人生,不同的选择带来不同体验。比如游戏里有个道具,打到人时百分之百可以进入处决,玩家拿了它,我大概就知道你想玩海盗、不想好好经商了。所以它代表着一种体验预期。
第二是技术问题:局内存档太大了,大部分游戏平台的云存档支持不了。所以我们做了全局和局内的拆分,全局存档可以放到云端,你换一台电脑也能接着玩。
硅星人: 在自由模式中你们如何约束和引导玩家?我看有一个世界性的"预言书",那些是随机生成的还是固定的?
刘寒: 是随机生成的。预言这个东西,也是我们做到最后才总结出来的。我们发现世界的变化需要一些引导,但如果引导过头、又或者让玩家自己去探索故事线,其实很难探索出来。所以我们做了一个类似"预言"的东西:每一次预言都随机抓取世界上的一些信息,给你三个选项确认下来。玩家有选择权,但又不至于要自己去找选择对象——对象我已经给你了,你可以选择改变或不改变,从而构建出一条属于自己的故事线。
目前这个版本的预言还偏离散。下个版本我们会让它更具叙事性:比如你第一张预言卡抽到的是农业,那下一张大概率还会给你农业的故事,三张卡里大概率还有一张农业的卡。这样如果你有兴趣,就可以继续顺着农业摸下去,随着预言的推进改变某个势力或种族的命运。

Knit 平台让六百多个 NPC 同时跑起来
硅星人: 接下来问季兴老师。超参数用了一个叫 Knit,这个引擎在游戏中具体解决了什么问题?如何把大模型、NPC 决策这些连在一起?
季兴: 我先澄清一下,它可能不叫引擎,更像是一个平台。Knit 的完整定位是一个面向商业化的 Agent 智能体解决方案。它是我们在和寒哥共建《遥远行星:建造师》的过程中沉淀出来的。在AI原生游戏开发的过程中有很多重复性工作,我们索性把这个平台沉淀出来,未来也能提供给外部使用。它是一个智能体开发、运营一体化的平台。
它具体解决三件事:第一是"编排"。对于一个 NPC,怎么把模型、记忆、关系状态组织成一致且稳定的行为;
第二是"部署",几百个 AI NPC 背后的服务怎么接入游戏,扛住线上真实玩家的流量;
第三是"运营"。上线之后怎么监控游戏的线上状态、持续调优迭代。这三件事在市面上都能找到现有工具,但在一个真实项目里,必须在同一个地方把它们串起来、跑起来,这就是我们强调"一体化"的原因。
硅星人: 最近大家比较关注 Agent 集群,游戏里六百多个 NPC 同时运行。这六百多个 AI NPC 同时运行最大的难点在哪?
季兴: Knit 在《遥远行星:建造师》里的工作原理,是把几套割裂的系统抽象成一条节点化的决策链路。在我们的架构里,Agent 的决策本质上是一条多节点的工作流:游戏状态、数值系统是变量,系统任务是可执行的 action,而 Agent 的决策就是把这些节点串联起来的主线。换句话说,游戏里的各种定义都可以收敛成一个个数据节点,在统一链路里衔接、协同运转。
真正比较难的是"模型网关"这一层,我们内部叫"模型路由"。链路里有几个关键节点需要大模型来判断决策。难点不是"能不能调用模型",而是把模型调用做得足够可靠、可控:节点决策时到底用哪些模型?怎样才算失败?是返回结构异常、内容异常,还是超时?有没有 fallback 模型,如何降级与重试?这些是更工程化、更细粒度的问题。

硅星人: 超参数服务了很多游戏公司。在 AI NPC、AI 队友、AI 内容生成等众多模块中,您觉得哪个最接近商业化,哪个被高估了?
季兴: 我最早是从《王者荣耀》里的 AI 开始做起的,做这类商业化应用至今已经过去十年。所以最成熟的一定是游戏中"做行为"的AI,比如 AI Bot、AI 队友、AI NPC 这一类——它依托现有成熟的游戏,商业模式已经被验证。在过往很多 PVP 场景的案例里,我们的 AI 服务能给客户带来明显提升,比如 DAU 提升 最高达15%、留存提升 6%,在匹配时间、玩家活跃度等各方面都能给游戏产品带来明显的指标变化。这一块是最成熟、被反复验证过的。
至于哪个被高估,我换个角度回答:可能被高估的不是某一个方向,而是一种预期。在大模型这波席卷之下,有些人会认为"只要接入足够强的大模型,就能自动产出更多优质内容"。但 AI 内容生成——尤其是真正进入玩法循环的内容生成——它的不可控性和成本问题都还需要时间解决,目前还处在比较早的探索期。
即便我们从"活的长安城"一直探索到今天的《遥远行星:建造师》,我也觉得动态内容生成这条路是通的、价值是存在的,但它需要的不单纯是一个更强的模型,而是一套围绕模型的工程体系——包括记忆、行为的收敛、内容安全、成本控制。所以方向没有被高估,被低估的,可能是实现它的难度。
既懂游戏又懂 AI 的"AI 策划"
硅星人:像 Fable 这种最近刚出、能力特别强的模型——随着通用大模型能力越来越强,你们这种可以称为"垂直游戏 AI 公司"的壁垒会在哪里?
季兴: 我觉得首先是行业经验。作为专业化的"AI+游戏"解决方案提供商,第一方面是在服务游戏侧的经验上,如何把 AI 能力充分发挥出来,给玩家制造定向的游戏体验,这是经验层面的横向壁垒;第二方面是工程的部署和应用,因为这显著关系到最终的实施成本架构。
到了商业化层面,最终看的是投入产出比。我们在这个过程中积累了大量对外、对内的实施平台,一些内部的模型训练平台,以及一些优化算法,能够显著降低我们在训练阶段和部署阶段的成本,让整个商业化可控运行。
刘寒: 对我们来说,壁垒还是在于对用户的理解。作为游戏团队,体验的创造和对用户的理解一直是最重要的。新的大模型能否解决这件事?一定有帮助。但人终究是不同的个体,而且每个个体在时间上又存在不可逆性。所以游戏开发者最重要的,还是明确你想创造的体验,以及你的用户想要的是什么。
硅星人: 如果现在您来招人,您觉得 AI 游戏方面最缺哪类人才?
刘寒: 我觉得有两类人才比较缺。第一类,AI Native 挺重要的,他需要在日常生活中真的使用 AI 去解决很多问题。为什么这个特征重要?因为当一个人开始用 AI 解决日常问题,就意味着他对这个工具的边界和使用方式有了一定经验。
第二类,他对自己想做的事情能有非常清晰的描述。大模型什么都能干,但过去我们做设计时,常常把"任务"和"目标"混为一谈:很多时候我们聊的是"这件事怎么做",而不是"这件事的目标和期望体验是什么"。未来,"怎么做"这件事 AI 能帮你做很多,对人的要求就更多变成了"你要的是什么"——你能不能把目标体验清晰地描述出来,我觉得这里比较有挑战。
所以如果我们招人,会关注两个点:第一,他在生活中大量使用 AI,了解 AI 工具的边界和使用方法;第二,他对生活有洞察,能清晰描述出自己想要的体验、想创造怎样的世界。
硅星人: 季兴老师,如果您来招聘,觉得目前最缺哪类技术人才和落地人才?
季兴: 对我们来说,更缺的是既懂游戏又懂 AI 的人,内部会把这类人才归为"AI 策划"。一来这样的人在市面上确实稀缺,就像刘寒老师说的,需要的能力更复杂、更多元;二来 AI 在游戏中的应用,本质上是对传统策划过往工作经验和思路的一种冲击。所以内部也急需这样的人才。最近也有一些同学正在尝试——当我们想把 AI 技术更好地融入游戏、给玩家创造更新的体验时,他们能够给出更好的建议。我理解,对 AI 团队来说,更希望有这样的人才能和游戏方做好衔接。
消费者与创作者的边界正在模糊
硅星人: 当剧情、NPC 关系、经济结构都由 AI 动态生成时,所谓的"制作人"还剩下什么?未来游戏策划的工作会变成什么样?
刘寒: 我觉得还是要回到那个核心。当游戏里很多内容是随着玩家游玩过程不断生长出来的时候,这种生成并不是没有方向性的。就像"我们希望用大模型做什么"这个问题,需要由制作人或策划来回答。
未来玩家"消费者"和"创作者"的身份会越来越模糊,他既是消费者,又可能在游戏里创作,因为大模型能在各方面辅助他。但在这之前,仍然需要有人想清楚:这款游戏的游玩体验目标和预期是什么样子?这个预期还是要由游戏开发团队或设计团队在一开始想清楚。
AI 原生游戏离 TGA 还有多远
硅星人: 最后一个开放性问题。你们觉得 AI 原生游戏什么时候能拿到 TGA 这类游戏大奖?一年后、两年后还是三年后?
刘寒: 这个问题我最近也在跟朋友聊。我觉得,可能今天我们还在聊"AI Native"这件事,但到明年、后年,我们可能就不再聊这个话题了——因为 AI 对生活、对体验的渗透变得非常迅速。
去年我们还在聊:一个游戏只要有对话,就觉得它是 AI Native。但今天你会发现,在 Steam 创意工坊的 UGC 环境下,几乎所有有"人"的游戏,创作者都给它做了一个"NPC 对话"的 MOD——《杀戮尖塔》可以对话,《星露谷物语》也能对话。这件事在今天已经变成了普世需求,玩家觉得"和一个 NPC 对话"是很自然而然的事。
但我觉得到明年、后年,Agent 这个范式会慢慢走进游戏空间。我们可能不再满足于"每个 NPC 能对话",而是希望每个 NPC 能基于自己的人生理想或目标,在开放环境中做出属于他的选择。这可能是未来会出现的东西。
回到大奖这个问题,我换个方式回答:我觉得未来一定会有一款游戏含有极高的 AI 要素,这是游戏行业发展必然会走到的那一步。当然也有可能是 TGA 或某个比赛专门鼓励使用 AI,于是开了一个新赛道叫"AI Native 赛道",那里面一定会出现很多高强度使用 AI 的游戏。但我认为,在更大的全局奖、所谓"最佳游戏奖"里,一定会出现这样一款游戏:每个 NPC 都能对话,而且每个 NPC 都能自我驱动、自我行为。