GPT‑5真的来了! 一文详细介绍这次更新内容!
OpenAI通过“LIVE5TREAM”直播发布了 GPT‑5 新模型,这是继 GPT‑4 之后的首次重大更新!

CEO Sam Altman 表示,GPT‑5 是朝向通用人工智能(AGI)迈出的重要一步,将“像 PhD 级别专家”一样回答各种问题!

核心创新:统一模型与万字上下文
OpenAI总算去掉了乱七八糟的命名,这次所有模型统一命名为GPT-5!
GPT‑5 是一个“统一模型”,能在智能与速度之间动态切换:不仅基于输入内容智能选择“快速响应”或“深度推理”模式,还有一个实时路由系统判断使用哪种策略
这次GPT‑5在长上下文能力上得到显著提升,这意味着能够处理更复杂的问题!
对比,GPT-4.1和o3模型,GPT‑5在100w token上性能依旧强劲!

清晰的版本,回归正常定价策略
这次总共推出5个版本,不再搞让人看着迷茫的胡乱命名了
五个版本分别为gpt-5、gpt-5-mini、gpt-5-nano、gpt-5 Pro
gpt-5:
完整版,所有人,包括免费用户都可以使用!登录chatGPT默认选择模型,它会根据你提问难度,选择模式!
支持用户:免费/Plus/Pro/企业用户/API调用
gpt-5-mini
精简版本,在保留核心能力的同时极大降低计算与成本!
支持用户:Plus/Pro/企业用户/API调用
gpt-5-nano
急速版本,极低延迟、超高速度,适合即时响应场景
支持用户:API调用独享
gpt-5 Pro
增强版,增强了推理和并发能力,适合处理十分复杂的任务和超长生成
支持用户:Pro/企业用户/API调用
性能有所提升,可靠性大幅改善
这次GPT-5的提升总体看不够让人震撼,没有让人眼前一亮的感觉
AIME数学竞赛:94.6%(无工具) SWE-bench编程测试:74.9% 多模态理解:84.2% 医疗健康测试:46.2%

在编程基准测试 SWE‑bench Verified 中,GPT‑5 得分约为 74.9%
只是略优于Claude Opus 4.1 的 74.5%(具体表现还得测测)

相比之下,可靠性改善较多,幻觉大幅减少

作者观感
将近两个小时的视频观看下来,觉得这次GPT-5并没有划时代的感觉
但是整体的性能、可靠性有一定的拔高,也配得上这次大版本号的变化(4 -> 5)
短板提升较为明显,编程能力追上了顶尖的模型Claude Opus 4.1 ,两个不相伯仲。
其实整体架构设计、路由模式、幻觉减少只是让OpenAI的东西更好用,更加接近商用,但是距离真正的AGI,按照目前的进步速度,还是远远不够的
https://openai.com/gpt-5/
https://openai.com/index/introducing-gpt-5/