再见,人类程序员!OpenAI自曝:一行代码都不写了,100%用Codex

新智元报道
编辑:好困 Aeneas
【新智元导读】100%是用Codex写的。还有内部爆料说,Codex让他们仅用三天时间就搭出了服务器,三周就发布了APP。人类程序员,真的要退出历史舞台了?
硅谷的空气里再次充满了躁动,而这一次的震源中心,回到了OpenAI。
OpenAI的奇点时刻,也要来了?
就在刚刚,X被一条爆料彻底刷屏——
Codex,已经正式接管了OpenAI研究员「Roon」100%的代码编写工作!

Roon发出了感慨万千的宣告:
编程一直很痛苦,然而却是必经之路。我很高兴,它终于结束了。
我惊讶于自己竟然这么快就摆脱了编程的阴影,而且一点都不怀念它。甚至我有点遗憾,从前的电脑为什么不是这样的。

早在去年12月,Claude Code之父Boris Cherny就曾投下一枚震撼弹——
自己对Claude Code的贡献100%都是由Claude Code完成的。
这一「套娃式」的自我进化,直接引爆了硅谷的自动编码狂潮。
面对如此巨大的蛋糕,OpenAI显然不会拱手相让。
如今,反击已经开始。
在刚刚过去的周末,Sam Altman已经公开预告:接下来一个月会发布一堆关于Codex编码模型的新产品。

社区的风向也开始发生微妙的转变。
一些资深开发者评论道:在90%的情况下,GPT-5.2-Codex都能一次性完成我提出的请求。
Claude虽然不错,但它偶尔会偷偷插入「坏代码」;相比之下,OpenAI的新方案更像苹果——主打一个开箱即用。

看来,Codex和Claude Code的大战,已经一触即发!

人类写代码的时代,彻底结束?
OpenAI研究员Roon的这个爆料,也让网友们直言:AI终于到达了这个奇点!
看来,人类直接手写代码的时代,真的结束了。
经过多年的模型迭代与数据积累,我们似乎真的站在了一个临界点上:
人类直接手写代码,正在变得不再有任何意义,甚至是一种效率的浪费。

在Roon的评论区,人们开始集体对编程时代说再见。
是的,我热爱电脑,热爱软件开发,对我而言,编程只是实现目标的手段,仅此而已。

复杂的语法只是我们为了让逻辑得以执行而必须付出的昂贵代价。
如今,这些中间商终于可以退场了。


激进的观点开始涌现。
甚至有人建议,既然不需要人类阅读代码了,我们就该让模型跳过人类可读的汇编语言,直接使用机器代码。
今天的编程就像曾经的打孔卡一样,应该永远消失了。



与此同时,另一个炸裂的消息从OpenAI内部流出——
一位研究员爆料,在Codex的辅助下,他们仅用了三天时间,就从零搭建了OpenAI的MCP服务器,并完成了规模验证。
不仅如此,他们还在3周内推出了Sora的安卓应用;此外,还有一大波由Codex构建、甚至由Codex自我审核的内部工具正在排队上线。
如果没有Codex的话,很难想象OpenAI能以如此惊人的速度发布产品。
有趣的是,这位大佬似乎还玩起了Claude Code之父的梗:
过去30天,我花了大量时间审核Plan和PR,几乎没写一行代码!

有人评价,这正是「起飞」第一阶段的样子。
而下一步,或许就是真正的端到端AI自主研究。

还有人问,确定你们这不是营销?
这位研究者详细解释说,绝对不是。

具体的使用过程是这样的:
首先,他会花很多时间来撰写规格说明,并在脑海中构想输出应该是什么样子。
然后,会启动一个「4×Codex」的云端并发任务。这样不仅可以一次性看到多种不同的变体,也能补上自己一开始遗漏的细节。
接下来,就是让Codex自己发挥。等它跑完,人类再介入进行测试和验证。

Codex CLI 0.9+来了!
既然「人机协作」的范式已经改变,那么承载这种范式的工具自然也要升级。
面对Anthropic的步步紧逼,OpenAI显然有备而来。
就在今天,Codex CLI连续推送了两次更新,版本号直接来到了0.91.0。

其中,Codex 0.9.0带来了最受大家期待的功能——Plan Mode(计划模式)!

Code模式是Codex的默认体验,它的工作方式和其他AI智能体一样。
这点咱们就不多费口舌了。

但Plan模式则完全不同,它将编程任务拆解为两个截然不同的阶段:
第一阶段:理解意图(明确目标、划定范围、识别约束条件、制定验收标准)
第二阶段:技术规格(生成决策完备的实施方案)
在这种模式下,输出的内容非常详尽,无需任何后续追问即可直接执行。

Plan模式最聪明的地方在于:它坚持「证据优先探索」。
在开口问问题之前,Codex会先在你的代码库中进行2次以上的针对性搜索,检查配置、Schema结构、程序入口等。
此外,Plan模式还可以调用全套工具:
它可以(并且将会)调用各种技能、子智能体和后台终端,从而构建高层级的实施计划。

当Codex确实需要你输入时,它是结构化的,而且只有关键且聚焦的问题:
· 尽可能提供选项
· 总是包含一个推荐选项(对新手极其友好)
· 只问那些会实质性改变计划的问题
为了实现这一交互,它利用了新的request_user_input工具。
这个工具会暂停执行流程,抛出一道有针对性的多项选择题,并支持你在选择时补充反馈或上下文。
更贴心的是,一旦它在任何时候检测到歧义,尤其是当你在引导它时指令模糊,它会立即停下来确认,而不是盲目执行。
现在,开发流程变成了这样:
用户请求一个计划 -> AI研究代码库与规划 -> 针对性询问用户 -> AI完善并完成计划 -> 提示是否执行?


但是,代码谁来审?
看起来完美无缺,对吧?Codex负责思考,Codex负责执行,Codex负责填满你的GitHub。
但就在我们为这种极致的效率欢呼时,一个被忽视的深渊正在脚下裂开——
在这个新时代,最大的悬念不再是谁在写代码,而是谁来审核代码。
当AI火力全开,每天向仓库甩出10+个PR时,人类开发者面临的实际上是一场针对注意力的DDoS攻击。
AI生成代码是毫秒级的,而人类理解代码上下文是分钟级甚至小时级的。
这种「生产与审查的极度不对称」带来了两个可怕的后果:
审查者被淹没,开始习惯性点「Approve」,Code Review沦为形式。
那些看起来能跑、但缺乏系统性思考的代码块,正在像癌细胞一样在代码库中扩散。
利益冲突显而易见,但我们需要看透这一层。
Claude Code的创造者吹捧自己的工具天经地义——这是商业的本能。
但作为受众,我们不能把「Demo里的完美世界」当成日常。
毕竟,Demo不会展示调试三小时都找不到的竞态条件,也不会展示由于上下文丢失导致的逻辑断层。
除此之外,数据里还藏着一个迷人的悖论。
Ars Technica曾报道称,开发者对AI工具的使用量在涨,信任度却在跌。
为什么?因为AI正在跨越「恐怖谷」。
以前的AI代码烂得很明显,现在的AI代码烂得很隐蔽——它引用了不存在的库,或者在一个极其边缘的Case上埋了雷。
人们用得越多,踩的坑越多,信得自然越少。
正如Jaana Dogan所警示的,我们正在面临软件工程「琐碎化」的风险。
100个提交,可能让GitHub的绿格子很好看。
1个架构变更,可能需要三天思考,零行代码产出。
前者廉价如尘土,后者珍贵如黄金。
问题从来不是AI能不能写代码,而是它写的代码,是不是我们系统真正需要的,以及我们是否有能力维护它。

这对我们意味着什么?
无论我们是否准备好,这个时代已经来了。对于不同的人群,这意味着完全不同的生存法则。
致开发者
AI编码工具不是「即将来临」,它们已经破门而入。
问题在于,如何在不丢失自身核心价值的前提下整合它们。
技术大牛们依然在做那些艰难的思考工作,AI只是接过了「打字员」的工作。
如果你只会「搬运代码」,那你确实该慌了。
致非开发者
「技术工作」与「非技术工作」的边界正在消融。
Claude Cowork这类工具创造了新物种。曾经需要开发者才能搞定的任务,可能很快只需要你能清晰描述出你想要什么。
清晰描述需求的能力,将成为新的编程语言。

最后的话
虽然OpenAI的研究员和Claude Code的创造者都在宣称AI包办了100%的代码,但请记住——
那是他们的实验室环境,不是你的生产环境。
唯一可以确定的是,我们正在经历从「写代码」到「指挥写代码」的不可逆的转变。
而且,正在加速。
参考资料:
https://x.com/tszzl/status/2015253546372153347
https://jpcaparas.medium.com/the-claude-code-creator-says-ai-writes-100-of-his-code-now-956b2a5905ba?sk=4c840f27eb03694c8210086834a41691
https://x.com/LLMJunky/status/2015487691891024052