OpenAI 推出全新 GPT-5.2 模型，成人模式也即将登场

insunshine • 2025年12月12日 13:49 • 享玩

为了对应 Google 推出的 Gemini 3 Pro，先前市场就有传出 OpenAI 会推出更强的新模型，而就如同传闻，稍早 OpenAI 正式揭晓全新 GPT-5.2 模型，不意外的，各项测试分数都赢过 Gemini 3 Pro，唯一可惜是没有同步更新图片生成能力。除此之外，根据外媒报导，OpenAI 也已经预告成人模式登场的时间点，下面就整理给大家。

OpenAI 全新 GPT-5.2 模型登场，即刻起陆续推送给付费用户

OpenAI 最新 GPT-5.2 模型各方面都有明显提升，不仅速度更快，在数据搜索、制作简报、写作和翻译方面等，也都变得更好用。就如同前一代，ChatGPT 中的 GPT-5.2 也有三种模式，分别为

GPT-5.2 Instant：速度最快，在信息查询、作指南、逐步说明、技术写作与翻译方面都有显著提升，并延续 GPT-5.1 Instant 所导入的温暖对话语气。
GPT-5.2 Thinking：专为更深入的工作而设计，回应结构更清晰，提供的细节也更实用。
GPT-5.2 Pro：目前最聪明、最可靠的模型，适合需要高质量答案、且容许较长响应时间的艰深问题。

下图是GPT-5.2 Thinking和前一代GPT-5.1 Thinking的比较，可以看到在平时最常使用到的知识工作任务中，提升幅度超过80%：

基准测试	领域	GPT-5.2 Thinking	GPT-5.1 Thinking	提升幅度
GDPval（胜出或平局）	知识工作任务	70.9%	38.8%	+82.7%
SWE-Bench Pro（公开）	软件工程	55.6%	50.8%	+9.4%
SWE-bench Verified	软件工程	80.0%	76.3%	+4.8%
GPQA Diamond（无工具）	科学问题	92.4%	88.1%	+4.9%
CharXiv Reasoning（Python 辅助）	科学图表问题	88.7%	80.3%	+10.5%
HMMT（2025 年 2 月）	数学竞赛	99.4%	96.3%	+3.2%
FrontierMath（第 1 至 3 级）	高等数学	40.3%	31.0%	+30.0%
ARC-AGI-1 (Verified)	抽象推理	86.2%	72.8%	+18.4%
ARC-AGI-2 (Verified)	抽象推理	52.9%	17.6%	+200.6%

而大家很在意的幻觉问题，GPT-5.2 Thinking 同样变更低，错误率仅 6.2%，比起 GPT-5.1 Thinking 的 8.8%，下降达 38%：

GPT-5.2 Thinking 也是 OpenAI 至今最强的视觉模型，在图表推理及软件接口理解方面的错误率减少约一半，这代表说，你更不用担心 AI 辨识和判断错误的问题。

科学图表问题提升了 8.4%，准确率来到 88.7%：

图形用户界面屏幕截图理解提升幅度更大，多达 22.1%，GPT-5.2 Thinking 现在准确率已经超过 86%：

那跟百度最强的 Gemini 3 Pro 相比呢？ OpenAI 也在 X 官方社群中提供比较测试数据，GPT-5.2 Thinking 通通都领先：

OpenAI 表示在 ChatGPT 中，将于今日起陆续推出 GPT-5.2 Instant、Thinking 和 Pro，并率先提供给付费方案（Plus、Pro、Go、Business、Enterprise）用户，如果你还没看到，晚点后再试试。而前一代GPT-5.1也会以现行模型形式提供给付费用户，三个月后才会正式下线。