突发!OpenAI 放出“代码之神”GPT-5.2 Codex 剑指谷歌、Anthropic,网友实测后感慨:很贵很好用

编辑|冬梅
北京时间昨日深夜,OpenAI 正式发布了新一代智能体编码模型 GPT-5.2 Codex,并在官网同步发布技术博客,对该模型的定位、能力改进及部署方式进行了说明。
OpenAI 重磅发布 GPT-5.2 Codex
据介绍,GPT-5.2 Codex 基于通用模型 GPT-5.2 构建,并针对“智能体编码”(Agentic Coding)场景进行了专门优化,主要面向复杂的软件工程任务。相较此前版本,新模型在长程任务执行、大规模代码变更、Windows 原生环境支持以及网络安全相关能力等方面进行了系统性改进。
在工程能力层面,OpenAI 表示,GPT-5.2 Codex 通过引入原生的上下文压缩(compaction)机制,提高了对超长上下文的理解与利用效率,使模型在跨文件、跨模块的长期编码任务中具备更稳定的表现。同时,该模型在代码重构、迁移等涉及大规模改动的场景下,整体可靠性和一致性有所提升。

安全能力也是此次更新的重点方向之一。OpenAI 在博客中提到,随着模型在推理与工具调用能力上的增强,其在网络安全领域的适用性也随之提升。
官方披露,就在上周,一名安全研究人员使用 GPT-5.1-Codex-Max 配合 Codex CLI,协助发现了 React 框架中的三个安全漏洞,并已通过负责任披露流程提交给相关方,这些漏洞可能导致拒绝服务或源代码泄露风险。
在此基础上,OpenAI 表示,GPT-5.2 Codex 是其目前网络安全能力最强的 Codex 模型,但相关能力仍具有“双重用途”属性。根据 OpenAI 内部的“准备框架”(Preparedness Framework)评估,该模型尚未被划定为“高等级”网络安全能力水平,但公司在部署策略上已提前考虑未来能力增长所带来的潜在风险。
在发布策略上,OpenAI 选择优先通过受控渠道提供 GPT-5.2 Codex。目前,该模型已在 Codex CLI、IDE 扩展、云端环境以及代码审查流程中上线,并从即日起向所有付费 ChatGPT 用户开放。与此同时,OpenAI 正在推进 API 层面的安全开放方案,为未来第三方接入做准备。
针对网络安全相关使用场景,OpenAI 还同步启动了一项仅限邀请的试点计划,向经过审查的安全研究人员和组织提供用途受限的访问权限。该机制旨在支持已授权的防御性安全研究,同时保持对模型使用范围和风险的控制。
性能表现如何?
具体而言,各项性能表现如何?
在能力融合方面,GPT-5.2 Codex 继承了 GPT-5.2 在专业推理与事实准确性方面的特性,同时整合了 GPT-5.1-Codex-Max 在智能体编码和终端操作上的能力。OpenAI 表示,这种组合使模型在复杂工程任务中能够更稳定地调用工具、理解多模态输入,并在控制 Token 使用效率的同时完成长时间推理。
官方还指出,新模型在处理编码过程中共享的截图、技术示意图、数据图表和用户界面时具备更高的理解精度。在 Windows 原生环境下,GPT-5.2 Codex 的智能体执行效率和可靠性也有所提升。
在基准测试方面,GPT-5.2 Codex 参与了 SWE-Bench Pro 以及 Terminal-Bench 2.0 的评测。这两项测试主要用于评估模型在真实代码库和终端环境中执行实际工程任务的能力。OpenAI 表示,相关结果显示模型在上述场景中的整体表现较此前版本有所改进。

OpenAI 透露的一项网络安全评估显示,从 GPT‑5-Codex 到 GPT‑5.1-Codex-Max 再到 GPT‑5.2-Codex,模型能力在持续提升。

OpenAI 预计,未来的 AI 模型将继续沿着这一发展轨迹前进。
网友:好用,但成本略高
GPT‑5.2-Codex 的发布在各大平台上引发热议。
在 Reddit 上,有用户称相比此前使用的 GPT-5.2,新模型在编码能力上体感大约有一成左右的提升。他目前将模型运行在较高配置下,整体感受是表现稳定、可预测性强,执行过程可靠且逻辑清晰,在完成任务的同时还会对推理和操作步骤给出较为详尽的说明。
不过,他也指出,这一模型在运行过程中会消耗更多的 Token,因此对个人用户、业余开发者或小型企业而言,成本压力可能较大,并不一定是最优选择。但如果是中型企业,正在处理高度复杂、时间紧迫且具有关键业务影响的软件工程问题,这一模型的价值会非常明显,甚至会让人“心存感激”。
另一位该模型的深度用户对上述观点表示赞同。他表示:
“我从模型发布之初就开始使用,目前主要在中等到高档配置下运行(尚未尝试最高档)。在我的使用场景中,新版本相较于 GPT-5.1 Codex 有明显提升。
我正在编写复杂的信号处理代码,并会让模型进行在线检索,以确保输出基于真实数据和已有研究成果。从实际体验来看,整体效果非常出色。尽管我尚未系统对比该版本与 GPT-5.2 高配或超高配模式的差异,但后者不仅 Token 消耗极大,而且运行速度较慢。相比之下,目前使用的这一版本在速度和成本控制上显得更为均衡。”

对于 OpenAI 公司如此快速的迭代产品的行为,有用户表示这是很不可思议的。即便是在 FAANG 级别的公司,通常也需要数月甚至更长时间才能完成。该用户表示:
“任何在大型组织工作过的人都知道,这种方向性的转向,即便是在 FAANG 级别的公司,通常也需要数月甚至更长时间才能完成。
反过来看一个例子:ChatGPT 发布之后,谷歌大约花了将近两年的时间才实现明显的技术追赶,这一点其实相当夸张——毕竟 Transformer 架构最早就是他们提出的。相比之下,OpenAI 只用了几个月时间就迅速缩小了差距。
这只是我个人的感受,但在技术类工作上,GPT-5.2 的表现已经优于 Gemini。当然,Opus 的能力确实不错,但成本也很高,而且很可能是体量更大的模型。在这种前提下,两者在实际表现上依然咬得很紧,本身就已经很令人意外了。
再加上 OpenAI 最近密集达成的各类合作,不得不说,Sam 在企业层面的运作和谈判能力确实相当强。”

OpenAI计划再融1000亿美元,
估值或达8300亿美元
在 GPT‑5.2-Codex 发布之际,OpenAI 还被曝开启新一轮融资,最高募集 1000 亿美元。
据《华尔街日报》19 日援引知情人士消息称,这笔新募集的资金将用来支持其在人工智能领域持续扩张的长期战略。
如果该轮融资顺利完成,OpenAI 的整体估值可能升至约 8300 亿美元。
报道指出,这轮融资目前仍处于早期阶段,相关交易结构和条款尚未最终敲定,未来仍存在调整空间。知情人士称,OpenAI 希望最快在明年第一季度末完成本轮融资,但具体时间表取决于市场环境和投资者反馈。
若按计划完成,这将成为 OpenAI 成立以来规模最大的一次融资,也将是当前全球私营科技公司中最具规模的资本运作之一。不过,市场是否具备足够的投资者需求来消化如此体量的融资,仍有不确定性。
在公开市场对人工智能相关支出趋于谨慎的背景下,这轮融资被视为对 OpenAI 融资能力和长期战略的一次重要考验。近期,关于 AI 行业可能存在泡沫的讨论持续升温,已对多家相关科技公司的股价表现形成压力。但对 OpenAI 而言,维持模型训练、算力建设以及产品迭代所需的资本投入,仍然处于高位。
OpenAI 首席执行官 Sam Altman 近年来持续在全球范围内接触潜在投资者,试图建立更为稳固的资本池。《华尔街日报》此前曾报道称,OpenAI 也在权衡未来进行首次公开募股(IPO)的可能性。知情人士指出,在模型能力快速演进、竞争持续加剧的环境下,OpenAI 对资金的需求已远超传统科技初创公司的规模。
在本轮融资计划中,软银集团被视为关键出资方之一。报道称,软银已同意向 OpenAI 投资约 300 亿美元。为支持这一投资承诺,软银上个月出售了价值约 58 亿美元的英伟达股份。按照当前计划,OpenAI 预计将在今年年底前从软银处获得剩余约 225 亿美元的资金。
除软银外,OpenAI 近期也密集推进多项交易。报道提到,该公司在年底前完成了一项内容许可协议,并获得来自迪士尼的 10 亿美元投资。知情人士表示,鉴于本轮融资规模庞大,OpenAI 预计将引入主权财富基金作为重要出资方。此前,该公司已获得阿联酋投资机构 MGX 的资金支持。
多笔交易显示,即便在整体融资环境趋紧的背景下,OpenAI 仍具备较强的资本吸引力,但其长期扩张计划的资金可持续性仍受到外界关注。
参考链接:
https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2-codex/