行情中心 沪深A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

职场最强AI来了!OpenAI发布GPT-5.2,称明年1月解除“红色警报”

格隆汇 12-12 11:48

迪士尼 --%

在感受到谷歌Gemini3模型不断逼近的竞争威胁后,OpenAI于12月11日正式推出其最先进的人工智能模型——GPT-5.2。

值得注意的是,该模型明确以“为专业知识型工作而打造”为核心定位,堪称赋能职场人士的高效工具。

相较于前代产品,GPT-5.2在多个实用场景中实现显著性能提升,尤其在电子表格处理、演示文稿设计、代码生成、图像识别、长文本理解、工具调用及复杂多步骤项目规划等方面表现更加出色。

该模型在多项行业基准测试中均刷新纪录,部分专业任务的表现甚至超越了人类专家。OpenAI表示,开发GPT-5.2的核心目标正是帮助用户创造更大的经济价值。

GPT-5.2的三个版本——Instant、Thinking和Pro将从周四起陆续在ChatGPT中上线,并首先面向付费套餐用户开放。同时,这些模型的API接口现已面向所有开发者全面开放使用。


GPT-5.2 Thinking重塑AI生产力体验


GPT-5.2的三个版本针对不同场景进行了专业定位:

GPT-5.2 Instant
定位日常高效助手,在查询信息、提供指南、解释步骤、技术写作与翻译等场景表现提升显著,对话风格温暖自然,能够清晰呈现关键信息。
GPT-5.2 Thinking 
专注深度专业任务,擅长代码编写、长文档总结、文件分析、逻辑推演与结构化决策支持,可协助用户以更高完成度处理复杂工作。
GPT-5.2 Pro 
面向高难度、高可靠需求场景,在编程等复杂领域错误更少、输出质量更高,适合对答案精准度有严格要求的专业用户。

OpenAI着重介绍了GPT-5.2 Thinking,并将其定位为目前最适用于真实场景与专业工作的模型。在一项专门评测(GDPval)中,该模型成为OpenAI首个达到或超越人类专家水平的AI模型。

这项测试覆盖了美国GDP贡献最高的9大行业中的44种职业,要求模型完成如销售演示文稿、会计表格、急诊排班表等具体工作任务。

评估结果显示,GPT-5.2 Thinking在70.9%的任务中表现等于或优于顶尖行业专家。更值得注意的是,其处理这些任务的效率极高:输出速度可达人类专家的11倍以上,而成本不到专家的1%这表明,在人工适度监督与协作下,GPT-5.2已能够有效辅助专业知识型工作。

此外,在针对初级投资银行分析师的内部电子表格建模任务的基准测试中,GPT5.2 Thinking的平均任务得分较GPT 5.1提升了9.3%,由59.1%增至68.4%。其生成的电子表格和幻灯片更加复杂而且格式更美观。

在编程能力方面,GPT-5.2 Thinking在两项关键的软件工程基准测试中取得显著突破:在衡量真实工程能力的SWE-bench Pro测试中,得分达到55.6%;在SWE-bench Verified测试中,更是取得了80%的最高成绩。

这意味着在日常专业开发中,该模型能够更可靠地执行调试生产代码、实现功能需求、重构大型代码库等任务,并显著减少人工干预。

与此同时,GPT-5.2 Thinking模型的事实准确性也同步提高,其幻觉现象明显减少,错误回答频率较前代下降38%,显著增强了在研究、分析与决策支持等专业场景中的可靠性。

在长文本处理方面,该模型同样表现卓越,能高效整合分散信息,在长达256K Token的测试中首次实现接近满分的准确率,可连贯处理多文件、大容量的专业文档。

视觉识别能力上,GPT-5.2 Thinking进一步巩固了优势,其图表与界面理解的错误率降低约50%,并能更精准把握图像内的空间关系,有力支持了金融、设计等依赖视觉信息的专业工作流程。

此外,该模型在工具调用与流程衔接上也更为流畅,能够稳定支持从数据提取、分析到报告生成的端到端任务,显著减少了跨环节工作中的中断,使复杂工作流的执行更加连贯可靠。

在数学能力方面,OpenAI介绍,GPT-5.2 Pro与GPT-5.2 Thinking已成为目前最能支持并加速科研进程的模型。在研究生级别的GPQA Diamond基准测试中,GPT-5.2 Pro取得了93.2%的成绩,GPT-5.2 Thinking也达到92.4%。在专家级数学评估FrontierMath(Tier 1-3)中,GPT-5.2 Thinking解决了其中40.3%的问题。这意味着,人工智能模型正切实推动数学与科学领域的研究进展。


明年1月解除“红色警报”


尽管OpenAI在2022年凭借ChatGPT引领行业,但如今竞争格局已发生显著变化。谷歌近期发布的Gemini 3模型获得科技界广泛认可,甚至促使OpenAI内部启动“红色警报”,以集中资源应对竞争压力。

不过,OpenAI应用部门首席执行官菲吉·西莫在发布会上澄清,GPT-5.2的发布并非是对外部威胁的仓促回应。

她表示:“发布红色警报是为了向全公司明确资源倾斜的优先级,并确定哪些项目可以适当延后。我们虽然全面增加了对ChatGPT的投入,这客观上促进了GPT-5.2的发布,但这并非我们刻意安排其在本周上线的原因。”

与此同时,首席执行官萨姆·奥特曼指出,谷歌Gemini 3的发布对公司核心业务指标的影响低于预期。他预计OpenAI将在明年1月解除当前的危机预警状态。

值得关注的是,尽管本次发布的GPT-5.2重点提升了逻辑推理与专业任务处理能力,但并未包含此前备受期待的图像生成功能。奥特曼在内部备忘录中明确表示,图像生成仍是未来发展的重中之重。据报道,OpenAI计划于明年1月推出另一款新模型,该模型将在图像生成质量、速度与功能特性上实现显著突破。

与此同时,产业生态合作也在同步推进。迪士尼于周四宣布向OpenAI投资10亿美元,并授权其在SoraAI视频生成器中使用旗下《星球大战》、皮克斯及漫威系列的角色与IP资源。这一合作将进一步拓展生成式AI在创意内容领域的应用场景,为OpenAI在多媒体生成赛道注入新的发展动力。

免责声明:本页所载内容来旨在分享更多信息,不代表九方智投观点,不构成投资建议。据此操作风险自担。投资有风险、入市需谨慎。

举报

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈