职场最强AI来了！OpenAI发布GPT-5.2，称明年1月解除“红色警报”

在感受到谷歌Gemini3模型不断逼近的竞争威胁后，OpenAI于12月11日正式推出其最先进的人工智能模型——GPT-5.2。

值得注意的是，该模型明确以“为专业知识型工作而打造”为核心定位，堪称赋能职场人士的高效工具。

相较于前代产品，GPT-5.2在多个实用场景中实现显著性能提升，尤其在电子表格处理、演示文稿设计、代码生成、图像识别、长文本理解、工具调用及复杂多步骤项目规划等方面表现更加出色。

该模型在多项行业基准测试中均刷新纪录，部分专业任务的表现甚至超越了人类专家。OpenAI表示，开发GPT-5.2的核心目标正是帮助用户创造更大的经济价值。

GPT-5.2的三个版本——Instant、Thinking和Pro将从周四起陆续在ChatGPT中上线，并首先面向付费套餐用户开放。同时，这些模型的API接口现已面向所有开发者全面开放使用。

GPT-5.2 Thinking重塑AI生产力体验

GPT-5.2的三个版本针对不同场景进行了专业定位：

GPT-5.2 Instant
定位日常高效助手，在查询信息、提供指南、解释步骤、技术写作与翻译等场景表现提升显著，对话风格温暖自然，能够清晰呈现关键信息。
GPT-5.2 Thinking
专注深度专业任务，擅长代码编写、长文档总结、文件分析、逻辑推演与结构化决策支持，可协助用户以更高完成度处理复杂工作。
GPT-5.2 Pro
面向高难度、高可靠需求场景，在编程等复杂领域错误更少、输出质量更高，适合对答案精准度有严格要求的专业用户。

OpenAI着重介绍了GPT-5.2 Thinking，并将其定位为目前最适用于真实场景与专业工作的模型。在一项专门评测（GDPval）中，该模型成为OpenAI首个达到或超越人类专家水平的AI模型。

这项测试覆盖了美国GDP贡献最高的9大行业中的44种职业，要求模型完成如销售演示文稿、会计表格、急诊排班表等具体工作任务。

评估结果显示，GPT-5.2 Thinking在70.9%的任务中表现等于或优于顶尖行业专家。更值得注意的是，其处理这些任务的效率极高：输出速度可达人类专家的11倍以上，而成本不到专家的1%。这表明，在人工适度监督与协作下，GPT-5.2已能够有效辅助专业知识型工作。

此外，在针对初级投资银行分析师的内部电子表格建模任务的基准测试中，GPT5.2 Thinking的平均任务得分较GPT 5.1提升了9.3%，由59.1%增至68.4%。其生成的电子表格和幻灯片更加复杂而且格式更美观。

在编程能力方面，GPT-5.2 Thinking在两项关键的软件工程基准测试中取得显著突破：在衡量真实工程能力的SWE-bench Pro测试中，得分达到55.6%；在SWE-bench Verified测试中，更是取得了80%的最高成绩。

这意味着在日常专业开发中，该模型能够更可靠地执行调试生产代码、实现功能需求、重构大型代码库等任务，并显著减少人工干预。

与此同时，GPT-5.2 Thinking模型的事实准确性也同步提高，其幻觉现象明显减少，错误回答频率较前代下降38%，显著增强了在研究、分析与决策支持等专业场景中的可靠性。

在长文本处理方面，该模型同样表现卓越，能高效整合分散信息，在长达256K Token的测试中首次实现接近满分的准确率，可连贯处理多文件、大容量的专业文档。

视觉识别能力上，GPT-5.2 Thinking进一步巩固了优势，其图表与界面理解的错误率降低约50%，并能更精准把握图像内的空间关系，有力支持了金融、设计等依赖视觉信息的专业工作流程。

此外，该模型在工具调用与流程衔接上也更为流畅，能够稳定支持从数据提取、分析到报告生成的端到端任务，显著减少了跨环节工作中的中断，使复杂工作流的执行更加连贯可靠。

在数学能力方面，OpenAI介绍，GPT-5.2 Pro与GPT-5.2 Thinking已成为目前最能支持并加速科研进程的模型。在研究生级别的GPQA Diamond基准测试中，GPT-5.2 Pro取得了93.2%的成绩，GPT-5.2 Thinking也达到92.4%。在专家级数学评估FrontierMath（Tier 1-3）中，GPT-5.2 Thinking解决了其中40.3%的问题。这意味着，人工智能模型正切实推动数学与科学领域的研究进展。

明年1月解除“红色警报”

尽管OpenAI在2022年凭借ChatGPT引领行业，但如今竞争格局已发生显著变化。谷歌近期发布的Gemini 3模型获得科技界广泛认可，甚至促使OpenAI内部启动“红色警报”，以集中资源应对竞争压力。

不过，OpenAI应用部门首席执行官菲吉·西莫在发布会上澄清，GPT-5.2的发布并非是对外部威胁的仓促回应。

她表示：“发布红色警报是为了向全公司明确资源倾斜的优先级，并确定哪些项目可以适当延后。我们虽然全面增加了对ChatGPT的投入，这客观上促进了GPT-5.2的发布，但这并非我们刻意安排其在本周上线的原因。”

与此同时，首席执行官萨姆·奥特曼指出，谷歌Gemini 3的发布对公司核心业务指标的影响低于预期。他预计OpenAI将在明年1月解除当前的危机预警状态。

值得关注的是，尽管本次发布的GPT-5.2重点提升了逻辑推理与专业任务处理能力，但并未包含此前备受期待的图像生成功能。奥特曼在内部备忘录中明确表示，图像生成仍是未来发展的重中之重。据报道，OpenAI计划于明年1月推出另一款新模型，该模型将在图像生成质量、速度与功能特性上实现显著突破。

与此同时，产业生态合作也在同步推进。迪士尼于周四宣布向OpenAI投资10亿美元，并授权其在SoraAI视频生成器中使用旗下《星球大战》、皮克斯及漫威系列的角色与IP资源。这一合作将进一步拓展生成式AI在创意内容领域的应用场景，为OpenAI在多媒体生成赛道注入新的发展动力。

GPT-5.2 Thinking重塑AI生产力体验

明年1月解除“红色警报”

行情