为了对应 Google 推出的 Gemini 3 Pro,先前市场就有传出 OpenAI 会推出更强的新模型,而就如同传闻,稍早 OpenAI 正式揭晓全新 GPT-5.2 模型,不意外的,各项测试分数都赢过 Gemini 3 Pro,唯一可惜是没有同步更新图片生成能力。 除此之外,根据外媒报导,OpenAI 也已经预告成人模式登场的时间点,下面就整理给大家。

OpenAI 全新 GPT-5.2 模型登场,即刻起陆续推送给付费用户
OpenAI 最新 GPT-5.2 模型各方面都有明显提升,不仅速度更快,在数据搜索、制作简报、写作和翻译方面等,也都变得更好用。 就如同前一代,ChatGPT 中的 GPT-5.2 也有三种模式,分别为
- GPT-5.2 Instant:速度最快,在信息查询、作指南、逐步说明、技术写作与翻译方面都有显著提升,并延续 GPT-5.1 Instant 所导入的温暖对话语气。
- GPT-5.2 Thinking:专为更深入的工作而设计,回应结构更清晰,提供的细节也更实用。
- GPT-5.2 Pro:目前最聪明、最可靠的模型,适合需要高质量答案、且容许较长响应时间的艰深问题。
下图是GPT-5.2 Thinking和前一代GPT-5.1 Thinking的比较,可以看到在平时最常使用到的知识工作任务中,提升幅度超过80%:
| 基准测试 | 领域 | GPT-5.2 Thinking | GPT-5.1 Thinking | 提升幅度 |
|---|---|---|---|---|
| GDPval(胜出或平局) | 知识工作任务 | 70.9% | 38.8% | +82.7% |
| SWE-Bench Pro(公开) | 软件工程 | 55.6% | 50.8% | +9.4% |
| SWE-bench Verified | 软件工程 | 80.0% | 76.3% | +4.8% |
| GPQA Diamond(无工具) | 科学问题 | 92.4% | 88.1% | +4.9% |
| CharXiv Reasoning(Python 辅助) | 科学图表问题 | 88.7% | 80.3% | +10.5% |
| HMMT(2025 年 2 月) | 数学竞赛 | 99.4% | 96.3% | +3.2% |
| FrontierMath(第 1 至 3 级) | 高等数学 | 40.3% | 31.0% | +30.0% |
| ARC-AGI-1 (Verified) | 抽象推理 | 86.2% | 72.8% | +18.4% |
| ARC-AGI-2 (Verified) | 抽象推理 | 52.9% | 17.6% | +200.6% |
而大家很在意的幻觉问题,GPT-5.2 Thinking 同样变更低,错误率仅 6.2%,比起 GPT-5.1 Thinking 的 8.8%,下降达 38%:

GPT-5.2 Thinking 也是 OpenAI 至今最强的视觉模型,在图表推理及软件接口理解方面的错误率减少约一半,这代表说,你更不用担心 AI 辨识和判断错误的问题。
科学图表问题提升了 8.4%,准确率来到 88.7%:

图形用户界面屏幕截图理解提升幅度更大,多达 22.1%,GPT-5.2 Thinking 现在准确率已经超过 86%:

那跟百度最强的 Gemini 3 Pro 相比呢? OpenAI 也在 X 官方社群中提供比较测试数据,GPT-5.2 Thinking 通通都领先:

OpenAI 表示在 ChatGPT 中,将于今日起陆续推出 GPT-5.2 Instant、Thinking 和 Pro,并率先提供给付费方案(Plus、Pro、Go、Business、Enterprise)用户,如果你还没看到,晚点后再试试。 而前一代GPT-5.1也会以现行模型形式提供给付费用户,三个月后才会正式下线。
ChatGPT 成人模式推出时间计划
除了发布GPT-5.2,根据外媒T Verge报导,在稍早的简报会中OpenAI应用部门执行长Fidji Simo,也向记者表示预期ChatGPT的「成人模式」将在2026年第一季推出。 同时补充,正式推出之前,OpenAI 希望能先把年龄预测这件事做得更准确。
