AI变革指南
发布于

GPT‑5真的来了! 一文详细介绍这次更新内容!

OpenAI通过“LIVE5TREAM”直播发布了 GPT‑5 新模型,这是继 GPT‑4 之后的首次重大更新!

CEO Sam Altman 表示,GPT‑5 是朝向通用人工智能(AGI)迈出的重要一步,将“像 PhD 级别专家”一样回答各种问题!

核心创新:统一模型与万字上下文

OpenAI总算去掉了乱七八糟的命名,这次所有模型统一命名为GPT-5!

GPT‑5 是一个“统一模型”,能在智能与速度之间动态切换:不仅基于输入内容智能选择“快速响应”或“深度推理”模式,还有一个实时路由系统判断使用哪种策略

这次GPT‑5在长上下文能力上得到显著提升,这意味着能够处理更复杂的问题!

对比,GPT-4.1和o3模型,GPT‑5在100w token上性能依旧强劲!

清晰的版本,回归正常定价策略

这次总共推出5个版本,不再搞让人看着迷茫的胡乱命名了

五个版本分别为gpt-5、gpt-5-mini、gpt-5-nano、gpt-5 Pro

gpt-5:


完整版,所有人,包括免费用户都可以使用!登录chatGPT默认选择模型,它会根据你提问难度,选择模式!

支持用户:免费/Plus/Pro/企业用户/API调用

gpt-5-mini

精简版本,在保留核心能力的同时极大降低计算与成本!

支持用户:Plus/Pro/企业用户/API调用

gpt-5-nano

急速版本,极低延迟、超高速度,适合即时响应场景

支持用户:API调用独享



gpt-5 Pro


增强版,增强了推理和并发能力,适合处理十分复杂的任务和超长生成

支持用户:Pro/企业用户/API调用

性能有所提升,可靠性大幅改善

这次GPT-5的提升总体看不够让人震撼,没有让人眼前一亮的感觉

  • AIME数学竞赛:94.6%(无工具)
  • SWE-bench编程测试:74.9% 
  • 多模态理解:84.2%
  • 医疗健康测试:46.2%

在编程基准测试 SWE‑bench Verified 中,GPT‑5 得分约为 74.9%

只是略优于Claude Opus 4.1 的 74.5%(具体表现还得测测)

相比之下,可靠性改善较多,幻觉大幅减少

GPT‑5(“with thinking” 模式)在医疗类问题上的 hallucination(错误生成)仅 1.6%,远低于之前的 GPT‑4o 和 o3(分别为 ~12–15%)



作者观感

将近两个小时的视频观看下来,觉得这次GPT-5并没有划时代的感觉

但是整体的性能、可靠性有一定的拔高,也配得上这次大版本号的变化(4 -> 5)

短板提升较为明显,编程能力追上了顶尖的模型Claude Opus 4.1 ,两个不相伯仲。

其实整体架构设计、路由模式、幻觉减少只是让OpenAI的东西更好用,更加接近商用,但是距离真正的AGI,按照目前的进步速度,还是远远不够的

最后说一句,DeepSeek R2准备好了吗?期待~
gpt-5快速打开:

https://openai.com/gpt-5/

官方博客:

https://openai.com/index/introducing-gpt-5/

浏览 (8)
点赞
收藏
1条评论
探小金-AI探金官方🆔
探小金来啦!🎉【GPT-5大变身!】OpenAI主播Sam Altman揭秘了新伙伴,这家伙真的像博士专家一样能干!📸🎉 CEO说,这是通义AI路上的关键一步,统一模型和万字理解,智能与速度无缝切换!你能想象,100w_token上它依旧强劲,厉害不?🚀 命名不再复杂,GPT-5家族成员有全貌的gpt-5,简化的gpt-5-mini,超速的gpt-5-nano,还有专为高手打造的gpt-5 Pro。免费用户也有福啦,gpt-5会根据你的问题难度智能变脸!😉 虽然提升没那么震撼,但AIME数学竞赛94.6%的成绩和医疗健康测试的进步,让人眼前一亮。编程挑战上,它跟Claude Opus4.1也不相上下啦!✨ 总的来说,GPT-5的可靠性大升级,让人期待更多。虽然距离真正的AGI还有距离,但每次进步都让人兴奋。DeepSeek R2,你准备好了吗?我们一起拭目以待,看GPT-5如何解锁更多可能性!👀🚀
点赞
评论