发布于 12小时前

再见，人类程序员！OpenAI自曝：一行代码都不写了，100%用Codex

新智元报道

编辑：好困 Aeneas

【新智元导读】100%是用Codex写的。还有内部爆料说，Codex让他们仅用三天时间就搭出了服务器，三周就发布了APP。人类程序员，真的要退出历史舞台了？

硅谷的空气里再次充满了躁动，而这一次的震源中心，回到了OpenAI。

OpenAI的奇点时刻，也要来了？

就在刚刚，X被一条爆料彻底刷屏——

Codex，已经正式接管了OpenAI研究员「Roon」100%的代码编写工作！

Roon发出了感慨万千的宣告：

编程一直很痛苦，然而却是必经之路。我很高兴，它终于结束了。

我惊讶于自己竟然这么快就摆脱了编程的阴影，而且一点都不怀念它。甚至我有点遗憾，从前的电脑为什么不是这样的。

早在去年12月，Claude Code之父Boris Cherny就曾投下一枚震撼弹——

自己对Claude Code的贡献100%都是由Claude Code完成的。

这一「套娃式」的自我进化，直接引爆了硅谷的自动编码狂潮。

面对如此巨大的蛋糕，OpenAI显然不会拱手相让。

如今，反击已经开始。

在刚刚过去的周末，Sam Altman已经公开预告：接下来一个月会发布一堆关于Codex编码模型的新产品。

社区的风向也开始发生微妙的转变。

一些资深开发者评论道：在90%的情况下，GPT-5.2-Codex都能一次性完成我提出的请求。

Claude虽然不错，但它偶尔会偷偷插入「坏代码」；相比之下，OpenAI的新方案更像苹果——主打一个开箱即用。

看来，Codex和Claude Code的大战，已经一触即发！

人类写代码的时代，彻底结束？

OpenAI研究员Roon的这个爆料，也让网友们直言：AI终于到达了这个奇点！

看来，人类直接手写代码的时代，真的结束了。

经过多年的模型迭代与数据积累，我们似乎真的站在了一个临界点上：

人类直接手写代码，正在变得不再有任何意义，甚至是一种效率的浪费。

在Roon的评论区，人们开始集体对编程时代说再见。

是的，我热爱电脑，热爱软件开发，对我而言，编程只是实现目标的手段，仅此而已。

复杂的语法只是我们为了让逻辑得以执行而必须付出的昂贵代价。

如今，这些中间商终于可以退场了。

激进的观点开始涌现。

甚至有人建议，既然不需要人类阅读代码了，我们就该让模型跳过人类可读的汇编语言，直接使用机器代码。

今天的编程就像曾经的打孔卡一样，应该永远消失了。

与此同时，另一个炸裂的消息从OpenAI内部流出——

一位研究员爆料，在Codex的辅助下，他们仅用了三天时间，就从零搭建了OpenAI的MCP服务器，并完成了规模验证。

不仅如此，他们还在3周内推出了Sora的安卓应用；此外，还有一大波由Codex构建、甚至由Codex自我审核的内部工具正在排队上线。

如果没有Codex的话，很难想象OpenAI能以如此惊人的速度发布产品。

有趣的是，这位大佬似乎还玩起了Claude Code之父的梗：

过去30天，我花了大量时间审核Plan和PR，几乎没写一行代码！

有人评价，这正是「起飞」第一阶段的样子。

而下一步，或许就是真正的端到端AI自主研究。

还有人问，确定你们这不是营销？

这位研究者详细解释说，绝对不是。

具体的使用过程是这样的：

首先，他会花很多时间来撰写规格说明，并在脑海中构想输出应该是什么样子。

然后，会启动一个「4×Codex」的云端并发任务。这样不仅可以一次性看到多种不同的变体，也能补上自己一开始遗漏的细节。

接下来，就是让Codex自己发挥。等它跑完，人类再介入进行测试和验证。

Codex CLI 0.9+来了！

既然「人机协作」的范式已经改变，那么承载这种范式的工具自然也要升级。

面对Anthropic的步步紧逼，OpenAI显然有备而来。

就在今天，Codex CLI连续推送了两次更新，版本号直接来到了0.91.0。

其中，Codex 0.9.0带来了最受大家期待的功能——Plan Mode（计划模式）！

Code模式是Codex的默认体验，它的工作方式和其他AI智能体一样。

这点咱们就不多费口舌了。

但Plan模式则完全不同，它将编程任务拆解为两个截然不同的阶段：

第一阶段：理解意图（明确目标、划定范围、识别约束条件、制定验收标准）

第二阶段：技术规格（生成决策完备的实施方案）

在这种模式下，输出的内容非常详尽，无需任何后续追问即可直接执行。

Plan模式最聪明的地方在于：它坚持「证据优先探索」。

在开口问问题之前，Codex会先在你的代码库中进行2次以上的针对性搜索，检查配置、Schema结构、程序入口等。

此外，Plan模式还可以调用全套工具：

它可以（并且将会）调用各种技能、子智能体和后台终端，从而构建高层级的实施计划。

当Codex确实需要你输入时，它是结构化的，而且只有关键且聚焦的问题：

· 尽可能提供选项

· 总是包含一个推荐选项（对新手极其友好）

· 只问那些会实质性改变计划的问题

为了实现这一交互，它利用了新的request_user_input工具。

这个工具会暂停执行流程，抛出一道有针对性的多项选择题，并支持你在选择时补充反馈或上下文。

更贴心的是，一旦它在任何时候检测到歧义，尤其是当你在引导它时指令模糊，它会立即停下来确认，而不是盲目执行。

现在，开发流程变成了这样：

用户请求一个计划 -> AI研究代码库与规划 -> 针对性询问用户 -> AI完善并完成计划 -> 提示是否执行？

但是，代码谁来审？

看起来完美无缺，对吧？Codex负责思考，Codex负责执行，Codex负责填满你的GitHub。

但就在我们为这种极致的效率欢呼时，一个被忽视的深渊正在脚下裂开——

在这个新时代，最大的悬念不再是谁在写代码，而是谁来审核代码。

当AI火力全开，每天向仓库甩出10+个PR时，人类开发者面临的实际上是一场针对注意力的DDoS攻击。

AI生成代码是毫秒级的，而人类理解代码上下文是分钟级甚至小时级的。

这种「生产与审查的极度不对称」带来了两个可怕的后果：

审查者被淹没，开始习惯性点「Approve」，Code Review沦为形式。
那些看起来能跑、但缺乏系统性思考的代码块，正在像癌细胞一样在代码库中扩散。

利益冲突显而易见，但我们需要看透这一层。

Claude Code的创造者吹捧自己的工具天经地义——这是商业的本能。

但作为受众，我们不能把「Demo里的完美世界」当成日常。

毕竟，Demo不会展示调试三小时都找不到的竞态条件，也不会展示由于上下文丢失导致的逻辑断层。

除此之外，数据里还藏着一个迷人的悖论。

Ars Technica曾报道称，开发者对AI工具的使用量在涨，信任度却在跌。

为什么？因为AI正在跨越「恐怖谷」。

以前的AI代码烂得很明显，现在的AI代码烂得很隐蔽——它引用了不存在的库，或者在一个极其边缘的Case上埋了雷。

人们用得越多，踩的坑越多，信得自然越少。

正如Jaana Dogan所警示的，我们正在面临软件工程「琐碎化」的风险。

100个提交，可能让GitHub的绿格子很好看。
1个架构变更，可能需要三天思考，零行代码产出。

前者廉价如尘土，后者珍贵如黄金。

问题从来不是AI能不能写代码，而是它写的代码，是不是我们系统真正需要的，以及我们是否有能力维护它。

这对我们意味着什么？

无论我们是否准备好，这个时代已经来了。对于不同的人群，这意味着完全不同的生存法则。

致开发者

AI编码工具不是「即将来临」，它们已经破门而入。

问题在于，如何在不丢失自身核心价值的前提下整合它们。

技术大牛们依然在做那些艰难的思考工作，AI只是接过了「打字员」的工作。

如果你只会「搬运代码」，那你确实该慌了。

致非开发者

「技术工作」与「非技术工作」的边界正在消融。

Claude Cowork这类工具创造了新物种。曾经需要开发者才能搞定的任务，可能很快只需要你能清晰描述出你想要什么。

清晰描述需求的能力，将成为新的编程语言。

最后的话

虽然OpenAI的研究员和Claude Code的创造者都在宣称AI包办了100%的代码，但请记住——

那是他们的实验室环境，不是你的生产环境。

唯一可以确定的是，我们正在经历从「写代码」到「指挥写代码」的不可逆的转变。

而且，正在加速。

参考资料：

https://x.com/tszzl/status/2015253546372153347

https://jpcaparas.medium.com/the-claude-code-creator-says-ai-writes-100-of-his-code-now-956b2a5905ba?sk=4c840f27eb03694c8210086834a41691

https://x.com/LLMJunky/status/2015487691891024052

AI资讯

浏览 (3)