OpenAI 推出全新 GPT-5.2 模型,成人模式也即将登场

为了对应 Google 推出的 Gemini 3 Pro,先前市场就有传出 OpenAI 会推出更强的新模型,而就如同传闻,稍早 OpenAI 正式揭晓全新 GPT-5.2 模型,不意外的,各项测试分数都赢过 Gemini 3 Pro,唯一可惜是没有同步更新图片生成能力。 除此之外,根据外媒报导,OpenAI 也已经预告成人模式登场的时间点,下面就整理给大家。

OpenAI 推出全新 GPT-5.2 模型,成人模式也即将登场 - 果派哥

OpenAI 全新 GPT-5.2 模型登场,即刻起陆续推送给付费用户

OpenAI 最新 GPT-5.2 模型各方面都有明显提升,不仅速度更快,在数据搜索、制作简报、写作和翻译方面等,也都变得更好用。 就如同前一代,ChatGPT 中的 GPT-5.2 也有三种模式,分别为

  • GPT-5.2 Instant:速度最快,在信息查询、作指南、逐步说明、技术写作与翻译方面都有显著提升,并延续 GPT-5.1 Instant 所导入的温暖对话语气。
  • GPT-5.2 Thinking:专为更深入的工作而设计,回应结构更清晰,提供的细节也更实用。
  • GPT-5.2 Pro:目前最聪明、最可靠的模型,适合需要高质量答案、且容许较长响应时间的艰深问题。

下图是GPT-5.2 Thinking和前一代GPT-5.1 Thinking的比较,可以看到在平时最常使用到的知识工作任务中,提升幅度超过80%:

基准测试领域GPT-5.2 ThinkingGPT-5.1 Thinking提升幅度
GDPval(胜出或平局)知识工作任务70.9%38.8%+82.7%
SWE-Bench Pro(公开)软件工程55.6%50.8%+9.4%
SWE-bench Verified软件工程80.0%76.3%+4.8%
GPQA Diamond(无工具)科学问题92.4%88.1%+4.9%
CharXiv Reasoning(Python 辅助)科学图表问题88.7%80.3%+10.5%
HMMT(2025 年 2 月)数学竞赛99.4%96.3%+3.2%
FrontierMath(第 1 至 3 级)高等数学40.3%31.0%+30.0%
ARC-AGI-1 (Verified)抽象推理86.2%72.8%+18.4%
ARC-AGI-2 (Verified)抽象推理52.9%17.6%+200.6%

而大家很在意的幻觉问题,GPT-5.2 Thinking 同样变更低,错误率仅 6.2%,比起 GPT-5.1 Thinking 的 8.8%,下降达 38%:

OpenAI 推出全新 GPT-5.2 模型,成人模式也即将登场

GPT-5.2 Thinking 也是 OpenAI 至今最强的视觉模型,在图表推理及软件接口理解方面的错误率减少约一半,这代表说,你更不用担心 AI 辨识和判断错误的问题。

科学图表问题提升了 8.4%,准确率来到 88.7%:

OpenAI 推出全新 GPT-5.2 模型,成人模式也即将登场

图形用户界面屏幕截图理解提升幅度更大,多达 22.1%,GPT-5.2 Thinking 现在准确率已经超过 86%:

OpenAI 推出全新 GPT-5.2 模型,成人模式也即将登场

那跟百度最强的 Gemini 3 Pro 相比呢? OpenAI 也在 X 官方社群中提供比较测试数据,GPT-5.2 Thinking 通通都领先:

OpenAI 推出全新 GPT-5.2 模型,成人模式也即将登场

OpenAI 表示在 ChatGPT 中,将于今日起陆续推出 GPT-5.2 Instant、Thinking 和 Pro,并率先提供给付费方案(Plus、Pro、Go、Business、Enterprise)用户,如果你还没看到,晚点后再试试。 而前一代GPT-5.1也会以现行模型形式提供给付费用户,三个月后才会正式下线。

ChatGPT 成人模式推出时间计划

除了发布GPT-5.2,根据外媒T Verge报导,在稍早的简报会中OpenAI应用部门执行长Fidji Simo,也向记者表示预期ChatGPT的「成人模式」将在2026年第一季推出。 同时补充,正式推出之前,OpenAI 希望能先把年龄预测这件事做得更准确。

(0)
insunshineinsunshine

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注