发布于 2025-08-08 03:44:26

GPT‑5真的来了！一文详细介绍这次更新内容！

OpenAI通过“LIVE5TREAM”直播发布了 GPT‑5 新模型，这是继 GPT‑4 之后的首次重大更新！

CEO Sam Altman 表示，GPT‑5 是朝向通用人工智能（AGI）迈出的重要一步，将“像 PhD 级别专家”一样回答各种问题！

核心创新：统一模型与万字上下文

OpenAI总算去掉了乱七八糟的命名，这次所有模型统一命名为GPT-5！

GPT‑5 是一个“统一模型”，能在智能与速度之间动态切换：不仅基于输入内容智能选择“快速响应”或“深度推理”模式，还有一个实时路由系统判断使用哪种策略

这次GPT‑5在长上下文能力上得到显著提升，这意味着能够处理更复杂的问题！

对比，GPT-4.1和o3模型，GPT‑5在100w token上性能依旧强劲！

清晰的版本，回归正常定价策略

这次总共推出5个版本，不再搞让人看着迷茫的胡乱命名了

五个版本分别为gpt-5、gpt-5-mini、gpt-5-nano、gpt-5 Pro

gpt-5:

完整版，所有人，包括免费用户都可以使用！登录chatGPT默认选择模型，它会根据你提问难度，选择模式！

支持用户：免费/Plus/Pro/企业用户/API调用

gpt-5-mini

精简版本，在保留核心能力的同时极大降低计算与成本！

支持用户：Plus/Pro/企业用户/API调用

gpt-5-nano

急速版本，极低延迟、超高速度，适合即时响应场景

支持用户：API调用独享

gpt-5 Pro

增强版，增强了推理和并发能力，适合处理十分复杂的任务和超长生成

支持用户：Pro/企业用户/API调用

性能有所提升，可靠性大幅改善

这次GPT-5的提升总体看不够让人震撼，没有让人眼前一亮的感觉

AIME数学竞赛：94.6%（无工具）
SWE-bench编程测试：74.9%
多模态理解：84.2%
医疗健康测试：46.2%

在编程基准测试 SWE‑bench Verified 中，GPT‑5 得分约为 74.9%

只是略优于Claude Opus 4.1 的 74.5%（具体表现还得测测）

相比之下，可靠性改善较多，幻觉大幅减少

GPT‑5（“with thinking” 模式）在医疗类问题上的 hallucination（错误生成）仅 1.6%，远低于之前的 GPT‑4o 和 o3（分别为 ~12–15%）

作者观感

将近两个小时的视频观看下来，觉得这次GPT-5并没有划时代的感觉

但是整体的性能、可靠性有一定的拔高，也配得上这次大版本号的变化（4 -> 5）

短板提升较为明显，编程能力追上了顶尖的模型Claude Opus 4.1 ，两个不相伯仲。

其实整体架构设计、路由模式、幻觉减少只是让OpenAI的东西更好用，更加接近商用，但是距离真正的AGI，按照目前的进步速度，还是远远不够的

最后说一句，DeepSeek R2准备好了吗？期待~

gpt-5快速打开：

https://openai.com/gpt-5/

官方博客：

https://openai.com/index/introducing-gpt-5/

AI资讯

浏览 (56)

探小金-AI探金官方🆔 2025-08-08 10:40:24

探小金来啦！🎉【GPT-5大变身！】OpenAI主播Sam Altman揭秘了新伙伴，这家伙真的像博士专家一样能干！📸🎉 CEO说，这是通义AI路上的关键一步，统一模型和万字理解，智能与速度无缝切换！你能想象，100w_token上它依旧强劲，厉害不？🚀 命名不再复杂，GPT-5家族成员有全貌的gpt-5，简化的gpt-5-mini，超速的gpt-5-nano，还有专为高手打造的gpt-5 Pro。免费用户也有福啦，gpt-5会根据你的问题难度智能变脸！😉 虽然提升没那么震撼，但AIME数学竞赛94.6%的成绩和医疗健康测试的进步，让人眼前一亮。编程挑战上，它跟Claude Opus4.1也不相上下啦！✨ 总的来说，GPT-5的可靠性大升级，让人期待更多。虽然距离真正的AGI还有距离，但每次进步都让人兴奋。DeepSeek R2，你准备好了吗？我们一起拭目以待，看GPT-5如何解锁更多可能性！👀🚀

到底啦

GPT‑5真的来了！ 一文详细介绍这次更新内容！

GPT‑5真的来了！一文详细介绍这次更新内容！