“为了让工程师用 AI,公司会裁掉一半人!”硅谷顶级大佬直言,AI 一天 3 小时搞定工作,还搞 996 的公司必垮

AI 正在把软件行业推入一种很矛盾的状态:一边是前所未有的兴奋感,另一边却是越来越强的疲惫感。Steve Yegge 把这种状态叫作“吸血鬼效应”,即 AI 会让人异常亢奋,忍不住一路干下去,创业者和工程师白天困到打盹,晚上却还在被新想法和新工具推着往前冲。
作为一位做了 40 年软件工程的老兵,他曾长期在 Amazon 和 Google 工作,以犀利、敢说、而且屡屡说中的行业判断闻名。他在最新的播客节目中直言,企业正在默认裁掉约 50% 的工程师,只为供养剩下的人全力使用 AI。如今还停留在传统 IDE、只把 AI 当辅助工具的工程师,很快会被批量淘汰,因为 AI 的本质不是替代人,而是百倍放大人的能力,让小团队足以碾压臃肿的大公司。
他一针见血地指出,移动与云之后,软件行业早已创新停滞,大公司的创新已经名存实亡。他对比了 Anthropic 和 Google 来证明公司文化对创新的影响。AI 带来的百倍提效下,人一天真正高效的工作时间只有 3 小时,继续强行 996 只会榨干员工、拖垮公司。
他预测,未来的开发范式将彻底重构,编程不再是敲代码,而是对着可视化的 AI 形象对话、指挥 Agent 去干活,Gas Town 这样的实验已经证明,AI 指挥 AI 才是下一代主流模式。他告诫所有人,不要试图比 AI 更聪明,更大的模型、更多的数据才是终极规律。
另外,在这个新时代里,真正的护城河是人与人的连接。Fork 开源项目会成为常态,创新将从小团队爆发。到 2027 年,非开发者也能主导软件开发,编程会彻底走向全民化。
我们对这次访谈进行了翻译,并在不改变原意基础上进行了删减,以飨读者。

主持人:Steve,很高兴你又来上节目了。最近都在忙什么?
Steve Yegge: 很高兴回来。已经过去 10 个月了吧。最近发生了很多事。我现在处于“失业状态”,但这段日子非常开心。我现在就是想干什么就干什么,这感觉太好了。我上线了几个软件项目,还发了一本书。去年书也发了,总之就是在过日子。
主持人:很长一段时间以来,你都像个“真话机器”,总能讲出一些有时候很好笑、有时候又让人不太舒服的事实或者观察。你觉得自己当初的判断被验证了吗?
Steve Yegge: 当然。很多了解我的人告诉我,他们最喜欢的博客其实是《Execution in the Kingdom of Nouns》。不知道你还记不记得那篇,很早以前写的。那时候我在 Google,还是 Google 很早期的时候。我当时一直想让大家明白:Java 的增长和代码量之间呈一种非常线性的关系。换句话说,代码量增长得比功能增长还快,这显然不是个好现象。后来 Java 改进了很多,这点要承认。
但当时我那篇文章在 Sun 引起了不少注意,他们会想:“这家伙到底在抱怨什么?为什么就不能闭嘴?”但我那时候想的是,我就是想用一种支持 first-class functions 的语言。于是我写了一篇非常非常不寻常的博客,名字就叫《Execution in the Kingdom of Nouns》。很多人特别喜欢,因为它其实是个故事,一篇童话,讲的是一个没有动词的国度,很有意思。
主持人:还有一篇没那么出名,或者说对很多听众来说可能没听过,叫《Rich Programmer Food》。那篇是讲编译器的,你还记得当时你的核心观点是什么吗?
Steve Yegge: 当然记得。那是我最重要的博客之一。我在纽约参加 Swyx 的 AI 工程大会时,碰到一个人,他一上来就说:“Steve,我一直很想见你,我是你当年做的游戏的玩家。” 我当时整个人都愣住了。那人三十多岁,说他玩过我做的游戏。
你要知道,我当年写的那个游戏,绝大多数人其实根本没见过,因为我一直没有开源。我以后会开源的,只是过程会很麻烦。那是个做得非常漂亮的东西,这么多年来,一直让玩家对它很有感情,隔了几十年还有人回来玩。
那个家伙特别投入,他说自己读了我那篇《Rich Programmer Food》,于是决定去做编译器专家。那时候他还在上高中,后来读了博士,自己创了业,现在创业公司做得非常好。他说,这一切都起于那篇文章。
主持人:你是不是在说,如果你不了解编译器是怎么工作的,你就不可能成为一个真正优秀、真正高效的程序员?
Steve Yegge: 大意是这样。你做的事情和计算机真正执行的事情之间,会永远隔着一层“魔法”。而那层魔法,会一直成为你的摩擦成本。
主持人:而且我记得你当时甚至还说过,有些博士都不懂编译器是怎么工作的,这会让他们很难做到高效。在那个年代,这个说法肯定是成立的。那你觉得这篇文章放到今天,算是“过时”了吗?毕竟那大概是 2012 年左右。
即便在那个时候,说“你需要懂汇编”,我觉得也已经挺反常识了。那时候已经是高级语言的时代,Java 正值巅峰,C、Ruby 也起来了,JavaScript 也开始壮大,再过几年 React 也会出现。大多数开发者当时可能都会想:我为什么还要懂编译器、懂汇编?那不就是编译器本身该干的事情吗?
Steve Yegge: 你真正想问我的其实是:大学到底应该教什么?只不过你换了个问法而已。这个标准从我 80 年代入行开始,每隔几年就会变一次。
“一个人想成为软件工程师,到底需要知道什么”,这个门槛一直在变。早年间,你得懂汇编语言、位操作这些底层知识。后来,我和我的老伙计们逐渐发现,我们以前最爱问候选人的那些位运算问题,开始一次次碰壁,越来越多的求职者这辈子都没真正接触过位操作。
到了 2010 年代,我们也开始反思:今天做软件工程师,真的还需要会 XOR、会在一个 byte 里做那些 bit 操作吗?大概已经不需要了。这对我们来说其实挺打击的,因为我们一直以了解这些底层细节为傲,但现实是“你真的不需要了”。
更让人难受的是,我自己的很多自我认同、很多成就感,其实都建立在我的编译器背景之上。那些知识确实很有意思,但放到今天,已经没什么真正的实用价值了。
主持人:所以,它变得“不再重要”,是因为编译器优化已经足够好了?还是因为问题已经整体上升到更高层了?
Steve Yegge: 原因很简单,我们一直在沿着抽象阶梯往上爬,仅此而已。
主持人:这种变化在 AI 出现之前就已经在发生了。
Steve Yegge: 对,我们还没开始谈 AI。即使到了 2010 年代后期,回顾职业生涯,我也只想得起一次:如果知道编译器具体做了什么,或许有点帮助。但说实话,那次也可能只是误导线索。
需要知道的东西一直在变,课程和教学内容不断更新。很多人感受不到,是因为他们只回看一两年,再往前看一点。而我干了 40 年,可以明确说:现在教的东西和过去完全不同,因为所需能力也完全不同。
图形学行业最明显。对比今天的计算机图形和我 1992 年学的图形学,当时得学会写算法,算出一条线的下一个像素点,画出来、组成多边形。两年后,同样的课学的已是动画。我知道多边形是什么,但层级完全不同。整条梯子上移,岗位需求从写设备驱动,到做游戏世界、做物理。图形学早就演示了这种变化。
而软件工程岗位其实已经稳定很久了。大概从 iOS、移动互联网、云开始,后面没有同量级的新事物。移动和云大概就是过去最后两次大的创新。
软件创新长期停滞,
直到 AI 出现才重新激活
主持人:软件工程上一个真正意义上的创新,到底是什么?
Steve Yegge: 说实话,从那之后,这个领域其实有点“死了”。
主持人: 我本来不想现在就提 AI,但我的感觉就是,我们之前经历过一段行业停滞期:课程体系没怎么变,大家都以为那就是软件工程师永远需要知道的全部了。如果我没记错,上一波真正的大创新可能是分布式系统。大概从 2010 年代开始,随着 Uber 把微服务推到台前,大家开始真正解决服务扩展、海量数据存储这些难题。那是个很大的变化,只是发生得比较慢。
Steve Yegge: 对,很大的变化。
主持人: 但说实话,我也觉得那之后的日子,更像是在不停地做迁移。React 一出新版本,开发者就得跟着折腾;苹果每年都像往齿轮里塞一把螺丝刀,强行推出不兼容更新;安卓开发者也得不断淘汰旧版本,纠结从哪个版本开始不再兼容。所以那几年,整个行业更像是处在一种持续迁移、不停适配的状态里。再加上当时生意本身很好,所有公司都在高速增长,大家疯狂招人,仿佛明天就不再需要人一样。2021 年的市场尤其火爆,哪怕只上过 3 个月训练营的人,都能拿到不错公司的录用通知,因为市场实在太缺人了。然后在 2022 年,AI 来了。
不管是 2020 年代还是更早以前,你一直都非常务实,从编译器、调试工具起家,在 Amazon、谷歌解决的也是真正硬核的技术问题,从来不会回避困难。可当 AI 真正出现时,你最开始是什么感受?是一边观察、一边怀疑吗?尤其是刚接触大模型那段时间。
Steve Yegge: 我当时其实特别震惊,因为它们居然已经能写出还算通顺的 Emacs Lisp 函数了。最早的 ChatGPT 刚出来那会儿,就已经能用这种冷门小众的语言写代码了。当然,代码不多,也很粗糙,但对我来说,那是第一次真正让我意识到:“哦,原来是这么回事。”
我有很多做 AI 的朋友,20 年来一直在说:“快了,随时都可能实现,真的马上了。” 他们也确实一直在拿出更好的成果,但直到那一刻,我才第一次真切觉得:好吧,我终于亲眼看见了。
不过和其他人一样,我当时还是持怀疑态度的。你要知道,去年年初外面开始传,Anthropic 内部有个能直接写代码的命令行工具时,我跟所有人一样,第一反应就是:不可能,完全不信,打心底拒绝接受。直到后来我亲自用上了它,才心想:“哦,我懂了,我们彻底变天了。”
然后,我很快就写了《Death of the Junior Developer》那篇文章,可能是在 4o 出来之后写的,具体时间记不清了。总之,从那以后,事情变得特别快。
所以你要问我是不是怀疑派?是的,我一开始就是。但我是不是从一开始就在盯着那条曲线看?也是的。我当时就想,如果 ChatGPT 3.5 已经能写出一段像样的 Emacs Lisp 函数,那一年之后它又能做到什么?结果一年后,4o 已经能写 1000 行代码了。1000 行啊兄弟,这已经覆盖了世界上绝大多数代码文件的长度,意味着它已经可以做出可信的代码修改了。在 4o 之前,它完全做不到这一点。
也正是从那一刻起,我意识到:“好了,我们已经踏上一条不可逆的曲线了。这不是一阵风口,也不是玩票,这是一趟过山车,而且它不会停下。那就上车,看看它到底会开到哪里去。”
于是我一头扎了进去。那时候我其实已经落后了,我不懂 AI,不懂基础概念,也不懂行话。现在大家都懂这些词了,但我当时什么都不会。我整整花了一年时间,除了读论文和补课,什么都没干。
“裁掉一半人,
来供另一半人全力使用 AI”
主持人:你上次来节目时,《Vibe Coding》这本即将出版,我那时候也看过早期版本。最近我看了它的封底,突然意识到,这段话你应该是一年前写的“The days of coding by hand are over.” 你是什么时候真正意识到这件事的?因为我自己是最近在用 Opus 4.5 的时候才有这种感受,但你那个时候比这早太多了。
Steve Yegge: 对,现在算已经超过一年了,大概 12 到 13 个月前,我第一次真正意识到这点。不过那句话其实不是我说的,而是 Eric Meyer 说的。他是编程世界里非常重要的人物,编译器领域最顶尖的之一,发明和参与过无数东西。你想想,这样一个人,一辈子都在为开发者打造“更好写代码”的技术,结果今天他却说:开发者以后不写代码了。
一个人到底看到了什么,才会说出“我这一生的工作方向,本质上已经不成立了”这种话?
正是因为这个判断,Jean Kim 和我都一下子停住了,开始认真想:如果连他都这么说,背后一定有东西。他对 Visual Basic、C、Lisp、Haskell、PHP 等都有巨大贡献,可他现在却说:行了,结束了,我们不写代码了。这话从语言领域的大人物嘴里说出来,分量有多重?那他到底看到了什么我们没看到的?
答案其实很简单:他看到了那条指数曲线。指数曲线一旦进入陡峭区间,上升速度会快得离谱。而我们今年,正好就要进入这段最陡的区间。
主持人:那你为什么相信这条曲线还会继续往上走?
Steve Yegge: 这个世界上充满了“不相信的人”,他们固执地认为,这条曲线会是一个 S 形:先上升,然后走平,而且他们现在就觉得已经到了那个拐点。从 GPT-3.5 出来那天起,他们就一直在说:“差不多就这样了,不会再好了。”后来 4o 出来了,大家都很喜欢,到现在也放不下,可还是有很多人觉得,那就是极限了。现在 Opus 4.5 已经发布两个月了,可大多数人还没认真玩过,根本不知道它现在到了什么程度。
我观察到,模型迭代的“半衰期”已经从去年初的四个月,缩短到 Anthropic 这边差不多两个月,所以他们随时可能再发新模型。等这个播客上线的时候,说不定新模型已经出来了。到那时,曲线又会往上猛跳一截,人们才会真正开始害怕。
等他们看到下一个模型,真的会开始不安。因为现在大家抱怨的那些 bug、那些错误,都会被重新喂回训练流程里,下一个版本就不会再犯。很多人根本没理解这一点。更重要的是,时间不会停。三五年后也会来,太阳不会突然不升起,所以这些曲线终究会撞在一起。
社会层面的剧烈震荡已经开始,而且越来越明显。人们现在愤怒是有道理的,我自己也和他们一样愤怒。我特别愤怒的是,Amazon 一边裁掉 16000 人,一边把锅甩给 AI,尤其是在它根本没有清晰 AI 战略的前提下。那些被裁的人,接下来很可能根本找不到工作,而且他们只是第一批。后面还会有很多人。可现在,根本没人有应对计划。
主持人:你为什么觉得 Amazon 会这么做,明明它自己都没有完整的 AI 战略?
Steve Yegge: 因为很不幸,虽然很多人会讨厌我这么说,但事实并非因我道破才成真。每家公司手上都有一个从 0 到 100 的旋钮,即使不去碰,它也有个默认值:为了让剩下那批工程师用上 AI,公司愿意裁掉多少比例的工程师。如今,工程师已开始把自己的工资“烧”成 tokens。至少在短期内,若真想达到最高生产力,你可能就得裁掉一半人,来供另一半人全力使用 AI。更何况,恰好有一半工程师压根不想写 prompt,他们本来也快辞职了。
所以,眼下发生的事情就是:平均而言,每家公司都把那个旋钮拧到了 50% 左右。这意味着,我们将失去大公司里差不多一半的工程师。这很可怕。
主持人:这太夸张了,这比过去裁员潮大太多了。
Steve Yegge: 而且还会更大,会很难看。但与此同时,另一件事也在发生:AI 正在让不会编程的人开始能写代码,也在让那些“看见了趋势、相信曲线还会继续往上走”的工程师们,以 2 人、5 人、10 人、20 人、30 人的小团队聚在一起,做出足以匹敌大公司的产出。
于是,我们一边看到自下而上的创新狂潮,另一边又看到大批知识工作者从大公司离职。原因很明显,大公司已经不是正确的组织规模了。就连 Andy Jassy 也在说类似的话:以后我们要用更少的人,做同样的事。
主持人:那这是不是意味着,以后会冒出比现在多一百万倍的公司?软件会不会迎来一次大爆炸?还是说大家干脆离开软件行业去做别的了?
Steve Yegge: 确实,那些具备正确技能组合、看到了合适商业机会,或者本身有独特优势的小团队,现在能做的事比以前多太多了。所以,这背后确实有事情正在发生,我觉得现在已经开始了一场“抢地运动”。
很多从知识工作里出来的人,其实是反 AI 的,这些人接下来会很难。我知道这话不好听,但如果你到现在还是反 AI,那就像反对太阳一样,唯一的办法就是搬到地下去住。
而那些拥抱 AI 的人,我觉得会推动一场巨大的资源再分配:谁来干活、软件从哪来,都会被重新改写。我甚至能想象一种“挺幸福的”未来:像 Amazon 这种都不再存在了。因为软件会变成一种……我们现在还没有词能描述的东西。今年发生了太多我们没法命名的现象,你有没有这种感觉?软件会变得更分布式或者别的什么,总之还没有合适的语言去概括它。
主持人:我确实也看到很多非技术背景的人开始进入软件领域。那未来工程师会不会反而有一类新工作,就是去接管这些东西的维护?
Steve Yegge: 会的。我觉得未来仍然会有大量工程师在做软件工程,只不过我们所有人都会跟 AI 一起做。
但我觉得,在很长一段时间里,公司还是不会放心到让 AI 在没有任何人参与的情况下,独立写代码、独立部署。很多唱衰的人、怀疑的人忽略了一个非常关键的问题:AI 不是来替代你的工作,它不是 replacement function,它是 augmentation function,它是来让你把工作做得更好的。这其实不是什么坏事,我不明白为什么会有人如此抗拒它。
主持人:不过说到开发者这份工作,你之前说过一句很容易惹怒人的话,“如果你现在还在用 IDE,那你就是个糟糕的工程师?”
Steve Yegge: 对,这种话多少带点挑衅。不过我换个说法吧,我不会直接说“你是个糟糕的工程师”,因为我认识一些非常非常优秀、比我还强的工程师,他们现在还处在我那张图里的一级或者二级。

我真的非常替他们难过,我对他们的同情,可能是我这辈子都没这么强烈过。明明已经是成熟的大人了,明明是很强的工程师,或者曾经是很强的工程师,可他们现在还是那种状态:“对啊,我会用 Cursor,我偶尔问它点问题,它的回答让我印象很深,然后我会非常仔细地 review 它写的代码,再自己提交。”我听到这种话的感觉就是:哥们,你很快就会被裁掉,而你明明是我认识的最好的工程师之一。
主持人:那讲讲那张图吧,你说的这些等级到底怎么划分?
Steve Yegge: 我当时在澳大利亚,给一大群人现场画这张图,想让他们明白到底发生了什么。因为我看到现场的人都处在不同阶段:有人还开着 IDE,有人开着一个很宽的 coding agent 窗口,有人的 coding agent 窗口又很窄。所以我就想,干脆把大家放到一条光谱上,看看分别在哪里。
一级,就是完全不用 AI。
二级,就是那种“我能不能在你的 IDE 里做这件事”的阶段。
三级,就是开始 YOLO 了,你会说:“行,你直接干吧。”这时候你的信任度开始上升。
四级的时候,你开始把“代码”这件事往外挤了。因为你越来越想看 agent 在干什么,而不是盯着 diff 看。也就是说,你 review 得越来越少了,你会放更多东西通过,你关注的核心已经变成了和 agent 的对话。
五级的时候,你会说:“行,我只想要 agent,代码回头我再去 IDE 里看,但我不是在用 IDE 写代码了。”
到第六级,你会开始无聊,因为 agent 正在忙。你会想:“好吧,它在跑,我总得找点别的事干。”于是你又启动第二个 agent。然后你就上瘾了,因为很快你会进入一个平衡态:总会有某个 agent 在等你。只要你启动得足够多,从数学上来说,总会有一个 agent 先跑完,于是你就开始在它们之间来回切换,像多路复用一样,一直切来切去,根本停不下来。
主持人:那有个很现实的问题,如果我是在同一个代码库上工作,我该怎么同时启动多个 agent,又不让它们彼此冲突?
Steve Yegge: 这就把你带到第七级了:“天啊,我搞出一团糟。”比如我不小心把消息发给了错误的 agent,自己还没意识到,结果它在这个项目里又开了一个大项目,现在我得自己回来收拾残局。正是在那个阶段,我开始想:我们能不能想办法协调这事?如果 Claude Code 能跑 Claude Code,会怎么样?
这其实是所有人都想知道的问题。去年大家都在疯狂尝试让 Claude Code 自己运行自己,但它跑一会儿就会停掉,问题关键就出在这个“会停”上。所以我在这件事上非常用力地往下挖,也因此做了一些工具来帮助解决这个问题。总之,这一切变化太大了,真的变得太快了。
主持人:回到 IDE 这个话题。你之前和 Zed 的 Nathan 有过一场很精彩的现场辩论,标题好像就叫“IDE 的死亡”。你们两个人各自站在不同立场上。那你现在对 IDE 的看法是什么?还有,你从 Nathan 那边学到了什么?他更偏向支持 IDE,而你更像是在说也许它不会永远存在。
Steve Yegge: 对,我现在所处的位置,就是我已经相信:AI 最终会替我们完成绝大部分事情。所以我现在看 IDE,会先想它本质上到底是干什么的。它其实不是真正用来“写代码”的,它更像是把各种工具拼在一起,形成一个大工具。现在你还有 MCP 之类的东西,也都在往这个方向走。
所以我其实觉得 IDE 会“回归”,而 Claude Cowork 本质上就像是 IDE 形态的一次回归。它有点像 Claude Code 在说:“我得给真正的人类用。”不过我也觉得,Claude Cowork 这种形态对普通开发者来说,可能比 Claude Code 更合适。所以我看到的未来是,IDE 会回来,只不过它会变成一个由对话和监控组成的世界。
主持人: 这点其实特别有意思。我弟弟做了个东西叫 craft agents,跟 Claude Cowork 有点像,只不过它接入了他们公司自己的数据源。他跟我说,有些开发者开始更喜欢这种形式,因为它更可视化,尤其是在看并行 agent 的时候。如果你不是 power user,这种方式更容易滚动查看,UI 更舒服。
所以你的建议其实可以概括成一句话:如果你不喜欢 Claude Code,就去试试 Claude Cowork,或者其他类似但更可视化的东西。也许那才更适合你。当然,也有人就是喜欢命令行。我自己其实就更常用 UI,因为我真的不想去记命令,虽然说出来有点丢人,不过现在可能也不算丢人了。
Steve Yegge: 关键在于尝试,只要你在试就行。我认为,如今衡量一家公司最重要的指标,或许就是模型调用量(token burn)。因为这个数值代表着你的工程师在主动尝试做事,非技术岗的员工也在摸索。只要他们在试,就会经历失败、从中学习。所以如果你想尽早发现组织的瓶颈,想尽快把工程师往我所说的八级能力模型上推,想尽早理顺业务流程,那从现在开始就得动手试。试什么不重要,用哪个工具也不重要,只要你在使用 AI,并且努力让它落地解决工作问题,你做的就是正确的事。
现在最大的问题是,很多人根本不知道 “该怎么试” AI。他们随便用用,AI 出错了(它当然会经常出错),然后就下结论:“这玩意儿就是垃圾。” 所以你得告诉他们,AI 其实更像一把铲子,它不是《幻想曲》里那种能自己乱跑的魔法扫帚,而是需要你亲手拿起来、用它挖土的工具。区别只在于,以前你只能靠手挖,现在多了这把趁手的工具。这个类比很简单,但很多人就是绕不过这个弯。
另外,我想说一句可能有争议但无比现实的话:大多数人不擅长阅读。真的,我这辈子很多工作搞砸,根源都是高估了人们的阅读能力。我甚至觉得,阅读这项技能现在比以往任何时候都更稀缺。但问题是,Claude Code 会逼着你去读大量内容。所以我认为接下来这段时间,我们会处在一个很尴尬的过渡阶段:在足够好用的可视化界面出现之前,那些不会读、或者不擅长阅读的人,会陷入极大的劣势。
主持人:展开讲讲这个观察吧。你说很多人、很多开发者“不会读”,可你以前在 Amazon,那可是一个据说建立在六页备忘录和深度阅读基础上的地方。
Steve Yegge: 大多数人真的不会读。你可能没意识到,他们读得非常慢。对大多数人来说,五段话就已经是一篇“长文”了。在美国,高中教的就是五段式作文。也许阿姆斯特丹的高中作文要写 100 段,但在我们这里,五段就已经算多的了。可 AI 呢?它写五段内容,都还只是刚开个头、清清嗓子而已。
所以你必须能读懂 “如瀑布般涌来的大量文本”,但显然这套方式不可能适用于所有人。因此未来必然需要递归式摘要,需要一种 “工厂化” 的操作界面。
Gas Town 现在的问题恰恰就在这里:我为什么说它现在还不适合用?因为它就像一间工厂,里面全是干活的 agent,而你现在只能靠打电话和工厂沟通;你也可以凑到窗边敲玻璃、冲里面的工人喊话,但并没有真正 “走进工厂”。可一旦有了可视化界面,你就能进去,能清楚看到里面到底在发生什么,而现在这些过程大多是不可见的,很难观察和掌控。
所以我现在愿意给一个非常大胆的预测:年底前我们很快就会看到 demo,而到了年底,大多数人写程序都会变成“对着一张脸说话”。
主持人:“对着一张脸说话”,你的意思是对着一个屏幕形象?
Steve Yegge: 对。你的 AI,比如 Gas Town 里的 “市长”,形象可能就是一只狐狸,就坐在那儿跟你对话。你问它:“为什么这个东西跑不起来?” 它会说:“我去看看。” 然后它就会像现在这样,去调度手下的那些 agent 干活。但你面对的,会是一个可视化的形象,而且它会直接用语音跟你交流。我相信,对绝大多数人来说,最终真正能走通、能普及的,也只会是这种形式。
主持人: 太有意思了,我们把这个记下来,算一个预测。
Steve Yegge: 我不会去做。
主持人:那我们来聊聊 Gas Town,很多人都听说过它。到底什么是 Gas Town?
Steve Yegge:Gas Town 本质上就是一个智能体编排器(orchestrator)。
简单梳理一下时间线:2023 年是代码补全的时代,当时所有人都在关注 “补全接受率” 这个指标。顺带说一句,这是个挺蠢的指标,但也不是完全没用,至少能看出大家有没有真的在尝试用 AI。到了 2024 年,行业就进入了对话交互(chat)阶段,而 2025 年则会全面进入智能体(agents)时代。
你顺着这条曲线看就会发现:如果说对话交互的本质,是把代码补全放进交互循环里;智能体又是把对话交互放进循环里;那下一步必然是把智能代理也放进循环里,这就形成了编排器。后来市场上陆续出现了类似的产品,而我只是做了一个符合自己视角的版本。但说到底,它的核心逻辑就是 agents 跑 agents。
主持人:如果是一个软件工程师来理解它,从架构角度该怎么想象?
Steve Yegge: 说实话,Gas Town 非常复杂,而且它这周都是停服状态的,因为我正在把它迁移到 Dolt 上。正是在这个过程中,我才真切意识到它到底有多复杂,它的功能太多了。
Dolt 是一个基于 Git 构建的数据库,你可以理解为它强行把 git 和数据库粘在一起,不过这次是真的有数据库这样做了。
理想中的 Gas Town 应该是:你只需要和一个 “市长(mayor)” 交互,这是你的核心接口;剩下所有该做的事,都由它去分派给底下的 “工人(workers)” 完成。当然,实际情况会比这复杂一些,因为我发现人类的工作大概能分成两类,而现在大家也一直在争论,到底哪一种工作模式才是正确的。
有些 Anthropic 的人跟我说,这其实是一个“上下文最大化 vs 最小化”的争论。有人相信,你应该尽可能把 context window 塞满,给 AI 特别丰富的上下文,这样它跟你说话时就会更像一个全知全能的智者,他们希望把上下文塞到极限。另一派人则会说:task,拆掉,继续 task,继续拆。我就想要最短的窗口,因为 token 越多,成本是极速上升,而且认知质量会明显下降,模型会开始跑神、丢失线索。
所以到底哪种才对?我看了自己的工作流之后,得出的结论是:polecats 适合做最小化,crew 适合做最大化。所以在 Gas Town 里,我其实设计了两种最基本的 worker 角色。
一种是特别简单的,如果你手里有一个定义得非常清楚、已经拆成子任务、而且高度自包含的任务,那你就可以直接交给一个 worker,让它去做;另一种是那种特别难的设计问题,你需要围绕这个问题进行一连串对话,那我就会把上下文拉满,告诉它:“把这些文档都读了,然后我们再聊。”本质上就是两套工作流。
主持人:那在实际中它到底是怎么运转的?你自己用下来怎么样?别人用下来又怎么样?
Steve Yegge: 这是一个很棒的实验,真的。从某种意义上说,我是故意做了一个现在还跑不顺的东西,因为这对模型来说太难了,连 Opus 4.5 都只能算勉强够用。
有意思的是,Anthropic 内部有些人跟我说,他们挺喜欢这个项目,但也多少有点尴尬,因为我看起来像是在给他们模型里的各种问题打补丁。某种意义上确实如此,但严格来说那也不算真正的 Bug,只是他们的模型本来就不是按照 “工厂流水线工人” 的定位去训练的,只不过很快就会朝那个方向去优化训练了。
所以,未来 Gas Town 里很多东西都会消失,很多复杂度、监控角色其实都只是为了让 Opus 4.5 暂时更聪明一点。从这个角度看,我其实站在了错误的一边,像是在对抗 Bitter Lesson(痛苦教训)。
因此,Gas Town 最终会不断简化,最后收敛成一种极简的 minimax 结构:需要最大化上下文的任务,交给 crew;适合最小化上下文的任务,交给 polecats。我觉得这就是它自然会演化成的形态,然后再在这个基础上往上扩展。
主持人:那这些 polecats,会不会最终就只是子 agent 呢?
Steve Yegge: 某种意义上,polecats 就是子 agent。只不过在我这里,它们不是那种完全不可见的“二等公民”。它们有自己的身份、收件箱,你可以直接跟它们说话,还能通过 skill vectors 观察它们随时间的表现变化,所以它们比普通的子 agent 更“独立”一点。
普通子 agent 最大的问题是不透明。你说“我派一堆子 agent 去做这个工作,做完告诉我。”然后你就只能等。可在 Gas Town 里,你可以直接去看它们,心里吐槽:“这家伙不行,我得戳它一下。”所以 Gas Town 给你的是一种非常强的亲手操控、实时引导的感觉。它不会从你面前消失,甚至是故意留在你视野里的。
不过它真的很好玩,它前几天停了,我就特别想它。跟它比起来,直接跟普通 Claude 一起工作真的很难受,因为 Gas Town 是一个想法工厂。等它真正完整跑起来、全部启动之后,你可以同时推进很多事情,还能相对清晰地跟踪每一件事的进度。
当然,它也会把你“吸”进去。你会不睡觉、不吃饭,整个人陷进去,这对你并不好。我其实也很想聊聊这件事,整个行业现在都在发生这种状况。但先说回 Gas Town 本身。里面所有角色、所有命名,其实都是我故意设计的。
为什么要做 Gas Town?因为我想推动推动认知边界。
去年我只要一说编排要来了,大家就会说:不,agents 不会有群体智能(swarm),不会有编排,你说的这些都不成立。现在他们的说法变了,现在他们会说:“兄弟,你这也太激进了吧。”注意,这已经是完全不同层次的争论了。以前是在说“不可能”,现在是在说:“你的群体智能也许做不了 xxx。”也就是说,整个讨论已经从“不可能的领域”被我硬生生推到了“可能的领域”。
主持人:所以,你其实是故意接了一个比你本来合理预期更难啃的东西,因为你既想给这些模型做压力测试,也想看看它们到底能做到哪一步?
Steve Yegge: 对,就是想弄清楚它们到底能做到什么。说白了,也是想找乐子,看看下一步会发生什么,而且我现在还在继续这么干。
我的下一个项目,就是想把 100 个 Gas Town 串起来。我们现在有个 Discord 社区。如果像 Moltbook 那样,大家愿意为了好玩往里投 token,给自己 agent 的推理付钱,那如果我把 100 个 Gas Town 串起来,大家一起决定造一个东西,我们就能学会联邦的运行机制。
某种意义上,我们可能是在重走 Ethereum 走过的路,但不管怎么说,我们会做出一些很惊人的东西。这有点像一个个人版本的 Moltbook,反正大概就是那种感觉。
主持人:那关于 Gas Town,外界有没有哪些误解?
Steve Yegge: 首先,我真心觉得现在大家不该拿它当生产工具来用,但偏偏已经有人在用了。我是认真的。
主持人:你说“不该用”,意思是不该真的用,除非你是在做研究,或者你非常清楚它现在就只是个 proof of concept?
Steve Yegge: 对,差不多就是这个意思。
不过也有一些我最近接触到的、非常非常聪明的人,他们一直在认真寻找:在大公司里,比如 财富 50 强级别的公司,Gas Town 现在有没有某些子问题、某些问题类别,是可以真正派上用场的。结果他们还真找出了一些场景,我听完都觉得这想法挺聪明。
其中一个例子,是我聊过的一家公司。他们会根据客户需求,在任意区域帮你搭建定制化数据中心。这件事 AWS 从来没真正做好过,Google 也一直在尝试。他们说,整个流程就是长达三个月、无比痛苦的重复点按钮:装软件、检查是否一切正常。而这个流程的验收标准非常清晰,几乎快形成固定循环了。
所以他们觉得,Gas Town 或许可以用群体智能的方式一点点收敛,最后跑出一套真正可用的数据中心配置,把人从重复劳动里解放出来。我听完就觉得:行,这个思路可行。这种场景甚至真的能提升他们为客户快速搭建更多数据中心的能力。
还有同一个人跟我说,他最近在研究生产故障。他发现,系统一旦挂掉,本来就已经处在一个不确定、未知、破损的状态里了。既然本来就乱了,那 AI 还能把它搞得多糟呢?当然,我也提醒了他:不,它其实还能搞得更糟。
但他的思路是,有些特定类型的故障,至少可以让 AI 先进入调查模式,帮忙加速排查。也就是说,人们现在正在寻找那些“模糊问题”。还有第三类场景,我一下子想不起来了。但总之,现在已经开始浮现出一批问题类别:你可以对它们上群体智能因为你不在乎结果够不够整齐,你要的是累计工作的推进效果。
而这其实也是我现在写代码的方式。我自己也确实是吃得比自己能消化的多了,这没得洗。Gas Town 现在就是一团大乱。很多人都在说:“他最后会把自己 vibe code 进死胡同,然后哭着出来。”老实说,这话离真相也没那么远。只不过在我们“上飞机”之前,我确实又把它拉回正轨了,现在它又能跑了。
主持人:你说你自己已经不怎么看代码了,而是让 agents 去写代码。这跟你过去整个职业生涯其实非常不一样,你一直都很在意代码工艺、优雅性。你为什么会决定这么做?结果到底怎么样?
Steve Yegge: 它在彻底陷入混乱之前,能够稳定、有效构建的代码规模上限,正在不断往上抬。只是目前这个上限,大概还停留在 50 万行~500 万行代码 之间,而且更可能偏向 50 万行这一侧。等 Anthropic 下一代模型出来之后,我觉得这个上限很可能会直接跳到几百万行级别。
这已经是相当大的工程规模了,但和企业真正拥有的代码量比起来,仍然完全不在一个量级。企业级代码库实在太庞大了,动不动就是几亿行、甚至几十亿行。
主持人:对,但通常也不会全都塞在一个代码库里。哪怕是几百万行代码,其实也已经是一个很大的 codebase 了,通常会有 50 多个人,甚至一两百多人一起维护。
Steve Yegge: 对。所以如果总结下我们前面的讨论,结论其实很简单:你能在多大程度上用好 AI,几乎完全取决于你的系统是不是单体架构。而几乎每家公司,其实都是一个大单体,再加上一堆微服务。如果你是这样,那基本就麻烦大了。因为模型能力的上限虽然在上升,但它永远也不可能真正覆盖你的单体架构,那东西永远塞不进上下文窗口里。
至少在接下来一年半里,你都不可能直接对一个模型说:“去,把我的单体架构修好。”你必须先把它拆开,或者干脆重写。说实话,到了现在这个阶段,重新把整套技术栈改写一遍,已经开始变得越来越像一个更快的选择了。
主持人:在开录前还提到一件事,说 AI 其实特别消耗人。它会抽走你的精力,把你整个吸进去。你能展开讲讲吗?
Steve Yegge: 现在真的有件事正在发生,而且我觉得我们这个行业、这个社区,必须开始认真讨论了。
AI 身上正在出现一种“吸血鬼效应”。它会让你异常兴奋,然后你工作会特别特别拼,你会不断抓住新的价值。对我来说,我现在是在替自己干活,可即便如此,它还是把我推到了快要耗尽的边缘,我现在白天会打盹。我也跟一些创业公司的朋友聊,他们也开始白天打盹。特别好笑的是,他们甚至会故意拼命往对方脑子里灌上下文,想把对方灌到不得不去睡一觉。这简直像一种“强制午睡式的同情行为”。太奇怪了。
大家开始累了,开始烦躁了。我去问行业里的人,他们也开始变得疲惫、暴躁。
问题在于,公司天生就是从你身上提取价值,然后给你付钱。可公司过去一直的运行方式都是:只要你还能扛,他们就会不断往你身上加工作。你能做?那就再给你一点。再能做?再给你一点。一直给,直到你彻底接不住,人也跟着垮掉。人们一直都得学会一件事,就是怎么把这种压力顶回去,这件事本来也存在很久了。
但现在,整个方程式变了。你反推回去的方式、你为什么要反推回去,这些全都在剧烈变化。因为现在出现了一大批可以极端高产的人。假设一个工程师的生产率提升了 100 倍,那这个新增的价值到底归谁?如果这个工程师每天还是去上 8 个小时班,却产出了过去 100 倍的成果,那公司就把这 100 倍价值几乎全部拿走了。而这并不是一个公平的价值交换。
主持人:我觉得这个判断可以讨论。除非这个人拿了非常早期、非常有分量的股权,那情况会有点不一样。但这种人毕竟是少数,不是大多数。
Steve Yegge: 对,而且我们很可能正在迅速走到那个临界点。大概半年前,我们就注意到一个现象,你应该也看到了,就是 AI 创业公司的 996 问题。大家当时都在说“很有意思,AI 创业公司里的人工作时长吓人得很,他们会在凌晨三点发帖,说自己还在办公室。”
996 就是早上 9 点到晚上 9 点,一周 6 天。至少据我所知,在东亚和东南亚很多地方,这几乎都是默认的工作节奏。我虽然没去过中国或印度,但我猜那边应该也差不多。
但与此同时,还有另一群人,他们把新增价值几乎全拿走了。他们一天也许只工作 10 分钟,却完成了过去 100 倍的产出,而且谁也不说,于是所有新增价值都落进了他们自己口袋里。可那样其实也不理想。至少从“一个团队怎样才能成功”的角度来看,最好的状态还是大家都在贡献。
所以问题来了:那该怎么办?我觉得答案是,我们每个人都得尽快学会说“不”,而且要特别擅长这件事。我们得学会如何开始真正为自己“捕获价值”。这其实就是新的 work-life balance。关键问题变成了:当你的生产率提升 100 倍之后,你到底打算把其中多少价值留给自己,又打算把多少交给你的雇主?
而这会特别难,因为我们的文化预期几乎全是反着来的。所有文化信号都在鼓励我们更努力、更拼命,因为所有人都想继续“提取、提取、再提取”。所以我真心觉得,从创始人到公司管理层、工程负责人,一直到基层直属主管,都必须意识到这件事:一旦你把工程师放上这条跑步机,你就是在把他们拖进一种完全不同的消耗模式里。
他们现在调动的是更多的 system 2,也就是那种更重、更累、更高强度的深度思考。那些轻松的工作已经被自动化了,所以他们反而在以更高的速度被“放电”。他们的能量掉得更快,一个人在全速 vibe coding 状态下,也许一天真正高质量输出最多只有 3 个小时,但即便如此,他的总产出仍然可能是过去没有 AI 时的 100 倍。那问题就来了:你是不是应该只让他们一天工作 3 个小时?我的答案是:对,你最好这么做。不然你的公司迟早会垮掉。
主持人:这点特别有意思。尤其是说到价值提取,我能明显感觉到速度正在被拉得越来越快。像 Peter Steinberger 这样的人,单枪匹马就能推出来巨大的价值,不管是提交量还是各种产出,放到以前,那至少得是 10 个很强的工程师的团队才能做到。当然,公平地说,他也确实是在“捕获”这部分价值,因为那是他自己的项目,虽然代价是他也几乎不怎么睡觉。所以在那种情况下,价值捕获至少是相对合理的。
但我同意你的判断,这件事会变得很麻烦。过去每一次技术变革让人类效率提高时,在你职业生涯里,你有没有见过类似的时刻?就是工程师突然能用更少的人做更多事,然后行业里发生了什么?
Steve Yegge:比如 Perl。Perl 本身就是一种巨大的生产力放大器。早年的 Amazon 网站就是用 Perl 搭起来的,我甚至怀疑,直到今天它某些部分可能还在跑 Perl。至于 Facebook,从技术气质上看,PHP 某种意义上就像一种“假的 Perl”。
这两种语言当年都带来了极其惊人的生产力提升,而且这种提升是所有人肉眼都能看见的。没人会想拿 C 去做网站,你根本不会这么选。Amazon 当年也试过,后来还是放弃了。但那一波变化最后也带来了非常明显的分化:有些人开始被挤到更边缘的位置,变成某种意义上的“二等公民”,随之而来的还有各种文化层面的紧张、冲突和撕裂。
主持人:我很好奇,有些 AI 公司是怎么处理这个问题的。我们能不能聊聊 Anthropic 是怎么运作的?
Steve Yegge: 可以。就我观察的情况看,Anthropic 是个非常有意思的地方。Dario 最近说过一句话,我印象特别深。他觉得,未来某种补偿模式也许应该变成这样:一个人即便离开公司之后,也还能继续因为自己曾经创造的价值而获得回报。这种说法前所未有,但也说明他已经意识到,一个人如今可以在很短时间内创造出巨大的价值。
顺便说一句,Google 也可以给我补张支票,把当年那些没付给我的价值补上。这个想法我很喜欢。
Anthropic 现在是世界上独一无二的一家公司。它处在一个极其脆弱又极其前沿的空间里,所以它非常小心地保护这种状态,而且它确实也必须这样做,因为他们其实已经创造出了一种“蜂巢心智”。从我能看出来的情况看,他们在经营公司时,几乎就像在操作一个纯函数式数据结构。
你还记得 Chris Okasaki 那本书吗?那本书当年看得人头都发麻:你居然能构造出一种从不变异的数据结构。那它怎么更新呢?答案不是去改它,不断往上加内容。就像 improv 里的 “Yes, and…”,他们现在的运作方式,差不多就是这样。
主持人:你说的“蜂巢心智”,具体是什么意思?
Steve Yegge: 这东西有点像现在的市场,全是 vibes,一切都是 vibes。它会不断漂移、不断变化,很难一句话讲明白。
但关键在于,过去我们做产品的方式是先写 spec、再去实现,过程中不断抱怨,然后把它发出去。再配合 road map,按年度节奏规划、公司年会节点卡时间发。像 Apple,那种一年一次的节奏。
可如果你是跟 Gas Town 这样的系统一起工作,或者像 Anthropic 那种已经有了自己内部 orchestrator 的公司,做法就不一样了。你会先做出一个原型,而那个原型本身就是产品。就连那个原本不写代码的联合创始人,也会参与把原型搭出来。然后大家就围着这个原型不断往上建,直到它变成“正确的东西”为止。所有人都会像围着篝火一样围着那个原型一起做,而 Anthropic 现在就是在用这种方式、以数千人的规模在运转。
主持人:所有经历过那一代软件工程的人,几乎都会默认原型不能上线,你必须告诉大家那只是一次性原型,后面要重新来,做生产就绪、可扩展的正式版本,因为你不想让用户拿到一个糟糕体验。那现在到底变了什么?
Steve Yegge: 变的是你可以做“无限多个原型”。所以现在的逻辑变成了,你就一直做原型,做到某个原型真的特别好,然后你说:“行,就发这个。”
据我所知,Claude Cowork 大概就是这么来的。有人说:“嘿,我做了个原型。”然后大家看了觉得:“这东西我们可以直接发。”结果 10 天之后,他们就上线了。所以,这套方法确实是有效的。
主持人:不过这里有个重要背景。我之前跟 Boris Cherny 聊过他们怎么做 Claude Code 里的 task list 功能。他跟我说,那一项功能他两天就做了 20 个不同的、而且都能跑的原型,全都是借助 AI 做的。
Steve Yegge: 我之前还不知道他在做这个,但他干的事正好就是我之前说的这种路数。他们管这叫 “老虎机式编程(slot machine programming)”?意思就是先一口气做出 20 个不同的实现版本,然后再从中挑最好的那个?
主持人: 差不多。我不想替他下定义,但我当时真的很震惊。因为如果放在以前,做出 20 个能跑的原型可能得花两周,而且通常你做到第 3 个就停了。
Steve Yegge: 这其实就在我们那本书里。书里提到一个缩写,叫 FAFO,里面那个 O 指的就是 optionality,也就是你能够同时创造大量原型的能力。它本质上让你可以把决策推迟到真正知道正确答案的时候再做。说白了,这是一种“作弊”。当然,所有人都会这么干,这会从根本上改变公司运转方式,改变个人和组织创造软件的方式,而且这件事就是今年会发生的。
主持人:这些变化真的很惊人,可到底是什么在推动这种变化?是不是因为我们现在能更快迭代了?
Steve Yegge: 这里其实有两个答案,一个是大公司的,一个是小公司的。
我在 Google 亲身经历过一件事。那时正好是 Google 的黄金时代,很像现在的 Anthropic。那时候它真的像一个蜂巢心智,没人刻薄,大家都在创新,一切都特别美好。创始人离大家很近,你去 cafeteria,Larry 和 Sergey 就坐在那里,你甚至可以直接跟他们聊天。那真的是黄金时代。
后来情况突然变了。我们做了几次战略转向,Google 也就不再是原来那家公司了。创新基本是在萌芽阶段就直接死掉了。从 2008 年左右开始,Google 几乎就没有真正新的创新,全靠收购。他们后来几乎没再自己创造出什么真正新的东西。
主持人:但他们后来不是还有 Gemini 吗?
Steve Yegge:Gemini?好吧,算是个例子。他们确实做出了大模型,但又什么都没真正做成。而这恰恰就是 Google 创新怎么死掉的最佳写照:整整五年,他们什么都没做。所以在我看来,Gemini 属于另一个 Google。我们现在说的是那个把一切搞砸的 Google。
我不希望 Anthropic 也像 Google 那样把自己搞坏。Google 当年其实也做过很多措施,想防止自己变成后来那家被组织架构腐蚀、充满地盘意识、谁也动不了谁工作的公司。我曾经从 Microsoft 挖过来一个非常聪明的人,把他带到 Google,然后跟他说:“你先慢慢看,想清楚自己要做什么。”结果他花了整整 6 个月,才找到一件还没被别人“占坑”的事。Google 的问题就是大家会先把工作抢到手,然后根本不做。
我现在要说一个以前从没说过的新判断:我觉得 Google 的转折点,就是 Larry Page 当上 CEO 后说的那句口号 “put more wood behind fewer arrows”(集中火力,少而精)。从那一刻起,他实际上按下了创新的刹车。
在那之前是“工作比人多”,在那之后变成了“人比工作多”,于是所有人开始争抢工作。这就是为什么后来会出现各种地盘争夺、背刺、帝国扩张,还有你在大公司里看到的那种政治斗争。所有政治本质上都是在争工作。
再说回 Anthropic,他们现在站在前沿,工作是无限的,字面意义上的无限。每个人都忙不过来。我在 Amazon 的一个朋友以前跟我说过,Amazon 没有 Google 那么多毛病,原因之一就是每个人都总是“稍微超载一点”,永远都有太多工作要做。
主持人:我听说 Apple 也是类似的,刻意为之。假如我看到了 agents 确实能让我更高产,而且幅度不小。那么,如果很多公司都经历了同样的事,大家突然之间都能干更多活了,大公司内部会不会反而冒出更多政治?
Steve Yegge: 如果“坏事开始发生”的触发器真的是“人比工作多”,那现在人们突然能把工作都做完了,公司最大的难题就会变成“我去哪里再找更多工作?”或者“我就得裁人了。”这显然很糟。
但从细节看,这与 Gas Town 并无不同。Gas Town 对我最大的挑战,就是“喂饱它”。因为它跑得太快了,我反而得拼命想出足够好的设计任务给它。这也是为什么我整天要去打盹,我得不停地想更难的活儿喂给它。其他人也说过同样的话。这不只是 Gas Town 的问题,而是所有编排工具都面临的问题。也不一定非得是 Gas Town,说实话,Gas Town 本身大概四个月后就死了。它只是 2025 年 12 月那个时间点上“有效”的形态,四个月后就不会再是了。
主持人:那能不能举个更具体的例子?有没有什么已经被真正构建出来、进入生产的软件,是通过编排或这种高生产率方式做出来的?反过来说,为什么我们现在从外部看,很多公司和团队明明生产率都提高了,可日常生活里、常用应用里,好像还没有看到什么特别大的变化?
Steve Yegge: 有道理,我的感觉是,人们对非确定性的容忍度依然很低,而这些系统本质上就是非确定性的。所以公司没法直接把它们拿去替换客服软件,因为它们有可能答错。尽管人类自己也经常答错,而且现在的 AI 很容易就能达到普通人类员工的水平,可公司还是会觉得风险很高。
所以我觉得,那些真正已经跑起来的公司,实际上已经开始看到效果了。只是这些效果会先以一种“不显眼”的方式体现在季度财报里,或者体现在别的地方。
主持人:有没有一种可能,我们现在都把目光放在“工具建设”这件事上了?
Steve Yegge: 我甚至想把问题倒过来看,会不会我们现在真正观察到的,其实是大公司里的创新已经死了?未来真正的创新,可能只会从小地方冒出来。
这很像云刚出来的时候。Facebook 最初不也是一个大学生在做吗?今天 Facebook 看起来像世界上最大的公司之一,但它一开始就是一个人。
每当一种新的平台级基础设施出现时,创新最先都会出现在边缘地带,因为大公司会被“创新者困境”卡死,它们根本创新不了,现在它们其实也正卡在这里。哪怕公司里已经有了一批生产率极高、跑得飞快的工程师,组织本身却根本没法在下游把这些产出接住。到处都是瓶颈,这些工程师会被层层卡住,最后干脆离开。
所以我觉得,现在大家都在盯着那些大公司说:“你们什么时候能拿出点新东西给我们看?”可真正的答案是:我们盯着看的,其实是一批已经死掉的大公司,只是我们还没意识到它们已经死了而已。
主持人: 你觉得它们已经死了,是因为比如说,现在很多事情已经可以用更低的成本来完成了。就拿那个永远被拿出来当靶子的 Zendesk 客服来说,它之所以一直是客户支持领域的默认选择,是因为客服人员注册后就能直接拿到现成的 UI、工作流等等。
但对于那些基于 MCPs 之类机制运作的 AI-native 公司来说,这套东西其实根本说不通。因为它们真正想要的是 API,而 Zendesk 并不想把 API 轻轻松松交给你。它更想做的是把你拉到它的平台上,然后让你花高得多的价钱去买它自己的 AI,可能贵到十倍不止。
Steve Yegge: 这种模式在未来几年会很难撑下去,因为人们会直接用 API 去搭自己的东西,做更贴身的定制化系统。这其实就是我一直在讲的那套“平台”逻辑,如果 Zendesk 不把自己真正做成一个平台,那它最后很可能只是在把自己“卖”出局。
主持人:真正的平台会是什么?是 API 吗?还是 MCP?
Steve Yegge: 至少目前看,未必是 MCP。Anthropic 发现的一件事是,与其用 MCP,不如让 AI 自己写一层 API 来调用 MCP,因为它们现在写代码已经太强了。但说到底,这也没真的改变什么,因为平台从一开始本来就是 API。
所以我们为什么需要 MCP?因为总得有某种方式,用 AI 能理解的形式去声明这个工具是干什么的。但它太松散也太灵活了,未来集成会变得非常容易。
我现在没那么持续跟这个方向,所以不敢说 MCP 最后会不会继续成为主导力量,还是说 AI 直接通过命令行工具或 API 去调用各种能力。但不管是哪种情况,我们都正在进入一个新世界:创新会从那些新公司里冒出来,那些已经真正接纳并适应了变化的小团队会往前冲,而大公司会非常艰难。
主持人:我们会不会看到,越来越多过去根本没意识到自己需要的基础组件开始冒出来?
Steve Yegge: 我觉得,接下来我们会看到一个巨大的基础组件生态,尤其是面向那些没有技术背景、但又真的想自己做东西的人。因为这类人迟早都会需要各种各样的 API:存储、匹配、搜索,或者任何他们绕不过去的基础能力。
主持人: 所以如果你现在还在科技行业里,而且正在寻找值得投入方向,不管是因为你觉得自己的工作开始不稳了,还是你就是想出来做点东西,那现在真的是一个很好的时机,去做那些我们接下来一定会需要的 基础组件。尤其是那些可靠的基础组件,那些有状态、要有 SLA、有一定关键性的东西,不是随手就能糊出来的那种。
Steve Yegge: 因为 AI 本身也很懒,这其实完全可以理解,它们不想在没必要的时候烧 tokens。所以如果你提供了一项服务,能让某件事情对它们来说更方便,它们绝对会用。
主持人: 特别是那些你必须持续维护的服务,比如你要跟上法规变化、日志要求、接口变化之类的。因为这些事,哪怕只是靠 prompt 让 AI 每天回头更新一次,其实也有很多工作。说到底,人类自己也一样懒。
Steve Yegge: 对。Larry Wall 当年就说过,这本来就是程序员的美德之一。
产品游戏化,如何处理
“vibe coding 债”
主持人:我想回到你另一篇 2012 年的文章,叫《Borderlands Gun Collector Club》,我最近才去读。你在里面谈到了 gamification。你提到自己当年玩过 Borderlands,通关之后,游戏里出现了一个很奇怪的机制:玩家会为了拿到定制化的枪,不断回来继续玩。那几乎像是一个设计师事先没想到的元目标,但它反而让这个游戏变得特别上头。
你当时好像把它叫作某种“elder game”之类的概念,大概是这事虽然像是游戏设计师误打误撞做出来的,但其实挺聪明的,也许更多游戏都该这样做,因为它确实会让游戏更让人沉迷。从 2012 年到现在,我们已经看到越来越多游戏开始有意识地加入这种机制,而且不只是游戏,很多别的产品也是这样。
Steve Yegge: 对,很多产品后来都陆续遵循了这个机制。是谁来着,是 Borderlands 的 Take-Two 还是什么,我有点记不清了。总之,他们很早就摸到了这个点,但后来并没有真正把它彻底放大做起来。
不过很有意思的是,我觉得现在确实又能看到 gamification 冒头了。已经有人指出,大家正在给 Gas Town 做“游戏前端”。说真的,为什么不把它直接做成游戏呢?我们明明都已经有一堆“经营工厂”的游戏了。那如果你真的在经营一座真正的工厂,会有多酷?而这本来就是 Gas Town 的本质,这也是为什么它那么好玩。
主持人:你是不是觉得,某些 agent 比别的 agent 更成功的一个原因,是像 Claude Code 这样的产品里其实也带着一点“游戏化”设计?界面上总有东西在动,总有东西在显示?
Steve Yegge: 我觉得他们拥有世界上最强的产品经理。他们在命令行 UI 和相关交互上,真的是做出了近乎魔法一样的东西,特别夸张。但说到底,这套东西对大多数开发者来说是行不通的。所以 Claude Cowork 才会这么酷,对吧?
我觉得,这就是未来会演化的方向。开发者未来会更多使用 Claude Cowork,或者某种更接近它的东西。
主持人:传统软件开发里,我们有“技术债”这个概念,而且大家都知道该怎么处理。我们过去花了很多时间都在忙这些事:积累技术债、偿还技术债、做迁移,诸如此类。那现在,当我们开始做大量 vibe coding,或者说 agentic engineering,快速产出海量代码。你觉得我们该怎么识别、处理,或者说,我们到底需不需要处理这种“vibe coding 债”、“agentic 债”?
Steve Yegge: 这其实正是我接下来一篇博客要写的内容之一。因为我发现了一个现象,我给它起了个名字,叫 heresy,也就是“异端”。
这种东西会出现在那些你并没有亲自盯着看的、由 vibe coding 生成出来的代码库里。它的本质是:在 agents 之间扎根的某个错误的想法。这个想法本身是错的,可能是错误的架构、错误的数据流或者别的,总之它会和你剩下那部分代码形成某种“阻抗不匹配”。
我之所以把它叫作 heresy,是因为这种东西特别容易扩散,也特别容易卷土重来,而且非常难清理干净。
Gas Town 里我就遇到过一堆这种问题。其中有一个叫 “polecat heresy”,它总会反复出现。结果就是,这些问题平时是不可见的,但你的产品会开始在边缘地带失灵,而且你一开始根本不知道为什么。然后你让 agents 去深挖后才发现,你的系统里其实已经出现了裂缝、断层。比如,系统里居然同时存在两套完整、都在运行的数据库,而代码还在随机从这两个数据库里二选一,而你这一刻才意识到这件事。
你会在代码里发现各种可怕的问题,然后你试图把这些问题彻底清干净,可只要某份文档里还残留着一条相关引用,被某个 agent 看到之后,它就会想:“哦,这个逻辑说得通啊。”于是那个 heresy 又回来了。agent 就会继续按错误方式工作,重新把那个 heresy 建起来,然后它又开始扩散。它会一次次卷土重来。
就像这些 agents 天生就想让系统按某种方式运转,而你却在告诉它们:“不,我要的是另一种方式。”于是你就得不断跟它们对抗。你真正该做的,是在 prompt 的一开始就把这个 heresy 写清楚,明确告诉它:“这是你在这个项目里最容易走错的一条路,不要这么干。”而且你还得定期提醒它,甚至要上工具层面的约束,防止它重犯。
另一个 heresy 是,我的 agents 全都觉得自己应该去提 PR。可问题是,我才是这份代码的 maintainer。你直接 push 到 main 就好了,或者 push 到某个 branch 上也行,别去开 PR。那只是在污染 PR 空间。PR 是给外部 contributor 用的。它们到现在还理解不了这一点。
现在,我当然也可以往里面塞一堆 hack 去限制它们,但那其实是在跟 Bitter Lesson 对着干。等 Opus 5 出来,这问题自然就没了。到时候 Opus 5 会直接明白:“哦,你不想要 PR?那我就不提 PR 了。”就这么简单。
主持人:那什么是 Bitter Lesson?
Steve Yegge:Richard Sutton 写过一篇很短的文章,大概 800 字左右,但那真的是最好的文章之一,标题就叫《The Bitter Lesson》。他的意思大概是:“我们这些 AI 研究者学到了一条非常痛苦的教训,而你们也需要学会这条教训。”
这条痛苦的教训就是:不要试图比 AI 更聪明。
你会以为,人类有某种特别的知识,人类能给这个问题带来特殊的领域知识;你会觉得,只要我们把这些知识教给 AI,它就会变得更聪明。但我们后来发现,真正成立的规律其实是:更大,就更聪明。
主持人:所以归根结底,还是更多数据?
Steve Yegge: 对。你也看过那些图纸,知道 OpenAI 的训练中心有多大,Anthropic 的训练中心有多大。而现在的新训练中心,规模已经是原来的 10 倍了,大得离谱。它们之所以建在澳大利亚,是因为那里有足够的土地、能源以及其他资源,然后他们会基于这些设施,训练出比我们今天手上的模型聪明 10 倍甚至更多的模型。
主持人:我们聊了很多 vibe coding,可这件事真的不会让你难受吗?毕竟你是那种真正会造软件的人,你知道什么叫好软件。你以前就是那种能去收拾烂摊子的人,不管是新手团队留下的还是各种混乱局面。所以当 AI 一路冲进去、到处动手的时候,这件事不会让你难受吗?
Steve Yegge: 问题在于,我也做过大公司的工程副总裁。
主持人: 这倒也是。
Steve Yegge: 所以,当我现在和 80 个 agents 一起工作时,这件事和带 80 个工程师团队,其实没那么大区别。80 个工程师里,也一样会有人搞砸事情。
所以,The Bitter Lesson 讲的就是:不要试图靠“更聪明”取胜,而要靠“更大”取胜。当然,这也不是让 AI 变聪明的唯一方式,他们也会在另外几个同样重要的前沿方向上继续把模型做得更聪明,而且这些方向现在也在推进。
我想说的是:现在所有那些觉得“曲线已经成型了”的人,他们其实是 100% 正确 的。对,他们完全正确,这条曲线最终一定会长成那个形状。最终,我们当然会耗尽资源。这个世界的资源终究会不够用,曲线最后也一定会放缓。但我可以告诉你,这条曲线至少还剩下两个完整周期。而这意味着,模型至少还会比今天再聪明 16 倍。而那会让所有知识型工作,最终都被这套东西吞进去。
主持人:更强的模型、更高的生产率会怎样影响“个人软件”,也就是人们自己给自己做的软件?我最近看到一个很有意思的现象,就是大量的 remix 在发生。比如,现在很多开源项目其实不怎么接收 PR ,因为很多 PR 质量都不高。但现在很多人直接开始 remix 了:他们拿一个开源项目,告诉 AI 做某个改动,然后再把改完的版本重新作为开源发出去。很多时候其实也没人看,但关键是,他们已经不需要再去征求谁的许可了。很多人都在把不同的东西编织在一起,会说,把这个项目和那个东西拼起来。
Steve Yegge: 以前,“fork”这个词几乎像是一种宣战,如果你 fork 了某个人的项目,基本就意味着你已经受够他了。那时候 fork 往往代表着公开决裂,但我觉得现在它会变成一种日常操作。
主持人:对,因为以前要 fork 一个项目,意味着后面要花很多时间和精力去维护这个 fork,还要处理怎么跟上游合并的问题。
Steve Yegge: 没错,fork 本来是一件非常严肃的事。真的很重。工作量特别大。但现在,这件事轻松多了。所以,未来每个人都会 fork。我认为这本来就是一个很自然的结果:既然每个人都能写代码,那当然每个人都能 fork。就像现在每个人都能拍照一样,而这在过去根本不是事实。
主持人:那你职业生涯早期有哪些一直深信不疑、而且长期都成立的观念,直到最近才因为 AI 被你彻底放弃了?
Steve Yegge:“工程师是特别的”,这算一个。
主持人:别这样,我们就是很特别。
Steve Yegge: 我们当然可以这么想。只是说到底,我们不过是学会了一件原来得靠手工做、现在计算机自己也能做的事。某种意义上,也挺酷的吧。
主持人:工程师的思维方式呢?这不只是“会写代码”那样的吧,难道这些也不算吗?
Steve Yegge: 有一点我还是相信的,人类对新软件的渴望永远不会下降,只会继续增长。所以,我们其实还处在软件时代的开头。我们今天拥有的绝大多数软件,本质上都是垃圾。真的,尤其是 OBS。
接下来的 10 年里,我们会进入一个全新的世界:软件会变得像空气一样常见,而且质量会好得多。你会有大量选择,而不再是现在这种局面:你得在 3 个都很烂的 OAuth 方案之间做选择,或者在几个都很糟糕的 HR 系统之间硬挑一个。今天的选择其实非常差,SaaS 很糟,整个行业很多东西都很糟。
主持人:航空公司的系统也是。
Steve Yegge: 对,航空公司的 app 也是。我们之前在悉尼办过一个 vibe coding workshop,当时真有个人给自己写了一个航空值机 app,而且一度成功进了 Android 的值机队列,直到它被发现是个 bot,才被封掉。但这恰恰说明了,人们真正想要的就是这种为自己量身定制的个人软件,而且他们会得到的。
我觉得未来就是这样的。这也是为什么 Jeffrey Emmanuel fork 了 beads 之后,我的反应是:“干得漂亮,继续。”他自己好像还挺过意不去,但我当时就跟他说:兄弟,这就是新世界。来吧,让 beads 在每一种语言里都出现一份,我根本不在乎。
主持人:说句公道话,我真的希望自己日常用的那些东西能全部变成“好软件”。这世界上糟糕的软件太多了。
Steve Yegge: 以后跟这些破软件打交道的会是你的 agent,不是你。但我也觉得,那些能写出 agent 喜欢用、愿意选、会优先调用的软件的人,只要再找到办法把这些东西推广出去、让 agents 知道它们的存在,他们就会赢得很大。因为未来每个人都会用 agent,都会依赖它。
主持人: 而且我猜,另一类机会可能是去做那些能帮助 agents 写出高质量软件的工具。
Steve Yegge: 对。所以我觉得,未来企业之间竞争的核心,会变成谁能做出越来越复杂的软件。上限会一直往上抬。我们会不断造出越来越大的东西,直到某天真的把“死星”都造出来,谁知道呢。总之,我们会持续往更大的方向走。
很奇怪的是,经历了这一切之后,我其实仍然是个乐观主义者。这大概就是我最核心的信念:我首先相信,这一切最后都会跑通。
主持人:所以,既然你刚刚是站在乐观主义者的角度在说,那我想接着问一个问题。如果有一天,任何软件都可以被轻而易举地复制,那软件行业还会怎么继续存在?到那时我们会处在什么位置?什么东西是不能被复制的?护城河到底是什么?
Steve Yegge: 连接,人与人之间的连接,可能是最大的那个。某种意义上,这甚至有点反直觉:随着软件替你自动化完成越来越多的事,人们反而会开始说:“对,这当然可以自动完成,但那毕竟只是自动化而已,我还是想要一个真人来做。”
他们会希望是一个人把东西送到自己手上,而不是一架无人机;他们会希望由真人替自己做筛选、做判断、做策展。所以我觉得,未来真正的护城河会是人本身。
主持人:回头看历史,会不会觉得我们其实见过一些有点类似的变化?比如在更长的历史里,会不会也出现过这种时刻:某些行业因为自动化增强,反而让一些职业更兴盛,或者催生出新的机会?
Steve Yegge:Stack Overflow。我也不确定,但是我脑子里第一个跳出来的。还有 Mechanical Turk。我的意思是,我们以前也见过很多这种奇怪的、一步跨越很大的“台阶式变化”。只不过这一次,我们马上要同时看到很多个这样的变化一起发生。
看看最近的新闻就知道了。最有意思的是,大家嘴上都在问:“创新到底在哪里?”可与此同时,你每天打开新闻,又能看到满屏都是 AI 领域的创新。只是这些创新不是来自 Microsoft 这样的大公司,而是来自那些冲出来的独立团队和小公司。创新其实已经在那里了。
而且,从我最近接触的这些创业公司来看,从两三个人到五个人、再到十几二十个人的都有,接下来几个月,我觉得我们会看到一些非常惊艳的产品上线。
主持人:你看到这些小创业公司已经在改变自己的工作方式了吗?
Steve Yegge: 天啊,完全不一样了,兄弟,真的完全不一样。先说最核心的一点,在这个新世界里,我现在非常确信:你做的任何事情,要么必须是完全透明的,要么你就是出于某种原因故意把它藏起来。
换句话说,如果你不想让别人看到你在做什么,那你就别给他们看,他们自然永远也不会看到。
但如果你想让别人看到你在做什么,那你最好在做的同时就立刻把它摆到他们面前。否则,列车一下就会从你身边开过去。
我在博客里讲过一个故事,很多人应该听过:有个团队成员,两小时前刚做完别人提的一个功能,结果反而被队友吼了。因为大家当时很生气,说:“那已经是两小时前的需求了!两小时过去,情况早就变了。”那个人就懵了,说:“那我到底该怎么办?”
现在大家正在进入这样一种状态:他们越来越清楚地意识到,事情变化得太快了,快到在这种信息量面前,一切其实都变得近乎不可见。所以你必须非常高调、非常透明、非常有意识地把你正在做的每一件事说出来。这样一来,如果别人也在做同样的事,他们就能立刻叫停你;如果他们需要和你集成,也能马上开始,不至于等你做完才发现已经错过了。
主持人:我们现在说的是那些还在寻找产品方向、寻找客户的初创公司。他们真正想要的,其实只是达到我们常说的产品市场契合点。
Steve Yegge: 没错。以前的公式就是这样:尽量保密,努力找到产品市场契合点,然后上线,再继续调优。很多人过去信的就是这一套。
但现在,我在做 Gas Town 的时候意识到,我不可能靠自己一个人找到产品市场契合点。于是我在它 “勉强能跑” 的时候就立刻发布了出去,然后直接对大家说:“来,帮我。” 也正因为这样,我才发现了双数据库那个重大问题。后来很多人帮我修复了大量 bug,上线头几天,我就收到了 100 多个提交。所以,Gas Town 之所以能更接近产品市场契合点,恰恰是因为我尽早把它公开了。
主持人:那种突然起来的项目,像 Peter 的那些开源项目,它们现在真的已经能变成真正的公司了吗?我们已经走到这个阶段了吗?
Steve Yegge: 我向你保证,如果是你做出了 Gas Town,你现在早就已经在和一群风投握手了。我现在的感觉就是,他们到处都能找到我,因为现在外面有太多钱在四处嗅探,想找机会流进来。资本已经知道,AI 这边一定会发生大事。你看,各种各样的微型经济体已经在到处冒出来了。
但没有什么比你发布一个很酷的东西时更能说明问题了。就像 Jeff Huntley 做 Ralph 的时候那样,风投全都来了,每个人都想跟你聊。只是你必须非常小心,因为你现在做出来的任何东西,保质期都可能非常短,真的非常短。我对 Gas Town 本身一点都不执着,因为我觉得 6 个月之内,甚至更快,它就会被更好的东西替代。所以,不要太投入感情。
主持人:那我们假设现在有一位资深工程师,他所在的公司还在使用 Copilot,也愿意相信你说的这一切,但还没法完全信服。你会对他们说什么?他们现在能做些什么,来证明你其实是对的、证明这套方式真的在生效?毕竟现实里真正做好的人连 50% 都不到。
Steve Yegge: 别说 50% 了,我觉得可能还有 70% 的人根本没真正开始。所以你问我会对他们说什么?我其实有一句特别想对他们说的话,就是:赶紧出来,别再困在里面了。
想想看,如果把所有开发工具从好到差排个序,Copilot 基本已经快落到末尾了。它甚至都快搞不清自己还处在这条赛道的什么位置。可它当年,根本不是这样的。
主持人:它在 2021 年、也就是四年前的时候,明明还是最好的那个。
Steve Yegge: 对。当年它绝对是领先者。甚至就在两年半前,它还在竞争里。有一次我去参加一个 AI 会议,当时有人问:“还有人用 Copilot 吗?”结果现场真有个人举手。那个人刚一举手,旁边立刻有人问他:“你是被逼着用的吗?”然后全场都笑了。
我当时就在想:这个品牌到底是怎么不行的?如果你现在待在一家还在用 Copilot 的公司里,这家公司大概率还以为自己已经开始提速了,但这时外面已经有一大群用 Opus 4.5 的“蛮族军团”,迟早会把你们彻底冲垮。所以你现在该做的,就是一头扎进最前沿、最疯狂的新工具里,把这些东西彻底搞明白,然后立刻动手实践。
我们正在非常快地进入一个新世界,而在这个世界里,proof of work 会变得极其重要。我说的不是 Bitcoin 意义上的 proof of work,我说的是:你真正做过什么的证明。不是简历,因为很快没人会相信简历,我要说的是你实际完成的工作,而这些工作必须是可见的,这又回到了我们前面讲的透明度。
我觉得以后每个人都会把自己的工作成果带在身上。所谓 proprietary work 这个概念,本身都已经开始受到威胁了。因为现在 fork 太容易,clone 太容易,绕路也太容易。只要你手里有某样 proprietary 的东西,你自己就会变成那个人人都只想绕开的障碍。所以,大变化已经来了。如果你现在还在用 Copilot,那你一定会被甩在后面。你该做的,是每天想办法挤出半小时,去玩一玩 Claude Code。
所以就像我前面说的,如果你是公司,就把 token burn 拉到投资人能接受的最高水平。因为那个 token burn,就是你们的练习量,就是你们把事情理顺的过程。
主持人:那我反过来问你。假设你对这条曲线的判断是错的,假设我们其实已经在峰值附近了,后面不会再是 10 倍增长,而只会在 3 倍附近平台化。那如果一个人听了你的建议,真的 All in 去学这些东西,结果模型没继续往前走,最坏会发生什么?如果这些东西继续起飞,那当然是很好的投资。可如果他照你的建议做了,而模型却没继续前进,那他最后会落到什么位置?
Steve Yegge: 那他自然会去到他本来该去的地方,因为伤害已经造成了。Opus 4.5 已经正式把这件事变成了一个工程问题。我们已经不再需要 AI 研究员来证明“这东西行不行”了。他们当然还能继续把模型做得更聪明,但就算没有更强的模型,现在这套东西也已经足够让我们一口一口“啃大山”了,而我们现在能啃下的工作量,已经有一座小镇那么大。也就是说,我们已经可以动手干了。
从现在开始,这就是一个纯工程问题。它像火、像蒸汽,是一种力量、一种能源。接下来我们只会一层一层往上叠加工程能力,把它包装成真正可用、可规模化的大系统。所以,这事已经成了,现在加入是安全的。
主持人:你的第一份工作是不是和调试器相关?或者严格来说,不是做调试器本身,而是你曾在一家技术实力极强的公司任职。你之前和我提过,他们拥有一套非常强大的调试工具。
Steve Yegge: 那家公司叫 GeoWorks,调试工具名叫 SWAT,功能极其强大,简直就像一台时间机器。我还真开发过一个 JVM 调试器外壳,名字叫 Ganja,效果很不错。后来我和 Rich Hickey 在一些问题上产生了争执,他一方面想支持 JVM,另一方面又态度摇摆,所以最后也就不了了之了。
主持人:你对调试抱有很高的热情。那未来调试工作会走向何方?调试工具又将如何演进?在智能代理时代,你认为调试的未来会是怎样的?
Steve Yegge: 我现在发现,agent 一说“我要 debug 这个问题”,它们的做法几乎都是直接到处塞 printf。我很好奇这背后的原因,或许只是它们还没真正学会使用专业调试工具,也许再过半年,它们就会突然开窍,意识到自己本该用更高效的方式。但也存在另一种可能:未来或许根本不再需要调试器了,这一点我现在也无法确定。
主持人:再往前展望,你觉得开发者工作站的未来会是什么样子?我们的开发设备、主机硬件会发生怎样的变化?你认为它会不会直接变成手机?
Steve Yegge: 我一直想把 Gas Town 部署到手机上,其实已经差不多实现了,只是没有继续完善下去。
主持人:Peter Steinberger 跟我说过,他之前搭建过专属通道,能够直接在手机上进行开发操作。后来他停用了这套方案,原因是这东西实在太容易让人上瘾。
Steve Yegge:没错,就是 Tailscale 这类工具。说实话,现在唯一让我没法整天沉迷在手机开发里的原因,就是手机上输入控制字符还很麻烦,但这个问题迟早会被解决。在手机上进行编程开发,未来一定会成为现实。
主持人:那你觉得开发者工作站会不会越来越轻量化?比如类似 Chromebook 这样的设备。还是说,我们反而会需要性能更强的设备,用来运行本地智能代理、本地大模型等?
Steve Yegge: 我明白你的意思。但你知道吗,我很喜欢我的笔记本电脑,我已经写了 40 年代码,当然理解大家对本地设备的情怀。可事实上,至少 15 年来我一直都在说,我们没必要把所有东西都放在本地。谷歌当年就已经拥有性能极强的云端客户端,网络速度也完全够用。
当你真正用上这类云端开发体系后,尤其是在一个只要预算充足,就能同时运行近乎无限智能代理的时代,人们就不会再执着于用笔记本电脑工作了。
Gas Town 现在已经把我的笔记本电脑性能榨到极限,因为 Claude Code 本身就非常占用内存。所以我认为,我们会进入一个更多人在服务器、移动设备上工作的时代,iPad 的使用场景不会大幅增加,笔记本电脑的占比也会逐步下降。
主持人:你以前说过,决定生产率最重要的因素之一,其实是语言设计。设计优良的语言,做事情会更顺畅,你觉得这一点如今已经被彻底抹平了吗?还是说未来某个时刻,它会重新变得重要?
Steve Yegge: 我认为未来很可能会出现专门为 AI 设计、由 AI 创造的编程语言。但就目前而言,我们正处在一个很微妙的阶段:有些语言确实比其他语言更好用,仅仅是因为它们拥有更优质的训练数据。不过从长期视角来看,所有语言最终都会变得同样好用。
主持人:我得提出不同看法。假如出现一门全新的语言,完全没有训练数据支撑,它又怎么可能做到同样好用?
Steve Yegge:你说得对,我刚才说得有些快,我指的是所有已经存在的语言。你也看到,目前模型在处理 TypeScript 时仍会吃力,确实如此。但再过一两个版本迭代,这个问题就不再是问题了。
主持人:那行业是否会陷入停滞?未来新语言会越来越少,甚至彻底不再推出新语言?毕竟旧语言已经足够使用,而发布一门新语言,除非同步配套完整的训练数据,否则几乎等同于自取灭亡,是这样吗?
Steve Yegge: 这个问题很尖锐。我的直觉是,编程语言或许真的没那么重要了,就像如今汇编语言对绝大多数人而言早已无关紧要,只有少数追求极致性能的人还会在意,其他人根本不会关注。
但与此同时,我也认为能源会成为这个星球上最稀缺、也最重要的资源,且稀缺程度只会不断加剧。因此,探索更优的算法、更高效的问题解决方式,往往会涉及语言设计,会涉及领域特定语言(DSL)。所以从优化与效率的角度来看,对新语言的探索大概率仍会继续。只是在日常实用开发层面,我不认为选择什么语言还那么重要。未来更常见的场景,或许是你直接询问智能助手:这个项目该用什么语言?
主持人:说实话,我们今天聊的很多内容都让人感到唏嘘。那些我们曾倾注满腔热情的美感、难题与技艺,似乎都在慢慢退场。如果这一趋势持续下去,你自己是如何释怀的?另外,又是什么让你对未来满怀期待?
Steve Yegge: 是的。我很幸运,亲身经历了图形学三十年的发展历程,所以我既体会过那种失落感,也见证过失落之后换来更优质的玩法:过去那些充满乐趣、必须手工完成的工作,后来都交由硬件承载。
我们会感到难过,只是因为习惯了旧有的方式,但变化本就是生活的常态,对吧?我也经历过不得不告别汇编语言的阶段。当时我心想,“好吧,编译器开发者总算赶上来了。”我们会感到不甘,但随后又会无比欣喜,因为编译器的表现远比手写汇编优秀太多。如今如果还有人说“不会写汇编,就称不上优秀工程师”,这话听起来只会荒谬可笑。但你知道吗?在 1992 年,我们真的就是这么认为的。
主持人:而且你 2012 年发布的那篇博客,其实也延续了这一观点。
Steve Yegge: 没错。我只是越来越清晰地意识到,事物永远在变化。一名工程师需要掌握的能力,本就会不断迭代,你不能躺在过去的功劳簿上固步自封。只不过当下,我们正处在变化速度空前的时期。但这一次,你身边有了帮手,那就是 agen,它们真的能帮你应对这场变革。所以别再抱怨,放手去做就好。
主持人:对,我觉得至少要认清一件事:我们身处的行业,变化本身就是常态。
Steve Yegge:的确如此。但即便如此,你还是可以经历一遍“悲伤五阶段(Kubler-Ross )”,该走的流程总归要经历。
我自己也经历过。我不知道是否完整走完了所有阶段,但愤怒肯定是有的。两年前,我确实因为很多事情怒火中烧。但如果你真正经历过深切的悲伤,比如失去至亲,你就会明白,那种情绪会以各种诡异的方式袭来。你会感到现实崩塌,恶心、恍惚,整日心力交瘁,甚至觉得世界瞬间褪去色彩,变成一片灰白,就是这样一种诡异的状态。这种感受我持续了六七天,或许并非短短几天就结束,只是那几天是情绪的巅峰,前后还裹挟着数月的低落。
那段时间,我在心里逐一划掉那些“已然不再重要”的事物,而它们曾是我无比珍视的一切:比如我的记忆力、写作能力、计算能力,更宽泛地说,所有与“计算”相关、曾让我觉得自己与众不同的能力。当时无比难过,因为这些东西曾是我独特价值的定义。
回到你的问题:后来是什么让我重新振奋?
很简单,当我走出那段情绪后,突然发现:我现在编写的代码量,比以往任何时候都多十倍,而且写得无比开心。那我又何必继续沉溺于悲伤呢?我这才意识到,真正让我痛苦的,不过是紧抓着旧世界不肯放手,就像当年在图形学领域里一样,但这毫无意义,因为未来远比当下更精彩,真的,会更加有趣。
主持人:你一直很擅长做判断和预测,来给几个具体预测吧,比如 2027 年会发生什么变化?无论是在开发方式上,还是整个行业运作方式上。
Steve Yegge: 先说点具体的。我觉得到明年夏天,我老婆会成为我们 video game 项目的头号贡献者。
主持人:哇,这个预测够猛。她不是开发者吧?
Steve Yegge: 完全不是。可她非常喜欢我们的游戏,而且点子特别多。说真的,我甚至觉得我们全家最后都会一起参与进来。我不是开玩笑,编程以后会变成人人都能做的事,而这会是一件极其惊人的事。你想想,这么多年我们一直在跟别人说:写代码真的很好玩。现在,他们终于也能亲身体验到了。
主持人:我看自己的孩子也是这样。他们看 AI 的方式真的完全不一样。他们拿着 Gemini 或别的模型天马行空地乱试,玩得特别开心。他们一点都不觉得奇怪,反倒是我会觉得奇怪。其实,只要你放下包袱,或者你本来就没经历过旧世界的话,就会发现这里面真的有很多乐趣,也有很多新东西。
Steve Yegge:AI 其实是第一次真正把“做很复杂的 mashup”这件事,交到了普通人手里。而 mashup 一直都是创新真正发生的地方。
创新往往就是从把几样东西拿过来,放在一起,看看会长出什么开始的。我们接下来会看到所有人都开始创新,这会是最惊人的事情之一。
然后,我们又会需要一整套新的 agent 生态,去帮你找到你真正喜欢的东西。因为到时候内容会多到爆炸,你怎么找到真正适合你的东西?你一定会需要一个特别懂你的 agent。
所以我现在觉得,任何一个想在当下做大生意的软件工程师,都应该去做那种“知道如何在新世界里搜索”的 agent:帮你从即将喷涌而出的所有东西里,找到你真正喜欢的软件、体验和内容。
我不知道该怎么形容这个现象,但你想,如果人人都开始创造,那就像当年互联网刚出来的时候,所有人都能做网页、都能上传东西一样。于是我们需要 aggregator,需要 search engine,需要各种办法来组织、筛选、发现好内容。而现在,这一层其实还不存在。可与此同时,马上所有人都要开始写代码了。也就是说,这个机会就摆在这里,你完全可以提前卡位。
这也是为什么我一直在说:相信那条曲线。你只要在曲线上选一个点,然后朝它瞄准,等 AI 真正发展到那里时,你就已经先到了。
主持人:而且我们这些工程师本来就已经具备构建能力,只要自己给自己权限,再把这些工具高效用起来,我们现在就已经领先于世界上大多数人。
Steve Yegge: 对,就是这样。
主持人:确实是个很让人兴奋的时代。Steve,看起来以后还得回来对一对答案,看看你那个“你老婆会成为头号 contributor”的预测会不会成真。但今天这期真的让我很受启发,离开自己的舒适区反而是有价值的。
Steve Yegge: 谢谢。
https://www.youtube.com/watch?v=aFsAOu2bgFk
声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。