行情中心 沪深A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

传播文化行业:OPENAI发布O3 图像深度思考与工具调用能力提升

国泰海通证券股份有限公司 04-20 00:00

本报告导读:

OpenAI 发布o3 和o4-mini 模型,首次将图像直接融入思维链,工具调用能力也有显著增强,提升了 AI完成复杂任务的能力,有望在游戏、教育、营销等领域应用。

投资要点:

事件:OpenAI 于 4 月 16 日发布推理模型 o3 和 o4-mini,以及开源的轻量级终端编程智能体Codex CLI。

o3 与o4-mini 在图像深度思考和工具调用方面表现突出。作为o 系列目前最智能的推理模型,模型首次将图像直接融入思维链,借助图片进行“思考”,且可以配合python 数据分析、网络搜索、图像生成等工具应对复杂任务,如上传照片、手写稿等场景下,即便图像模糊、倒置、质量不佳,也能准确识别并调用工具完成旋转、裁剪等操作。两款模型中,o3 推理能力更强、适合复杂分析场景,输入/输出每百万tokens 分别为10 美元和40 美元,相对上一代对标的o1 成本下降了1/3(o1 定价分别为15 和60 美元);o4-mini 以更低成本提供高效性能,输入/输出每百万tokens 的价格分别为1.1/4.4美元,与o3-mini 持平。

OpenAI 推出的Codex CLI 是基于o3 和o4 Mini 的轻量级终端编程Agent,已在GitHub 开源。Codex CLI 基于o3 和o4-mini 的推理能力,支持多模态输入,用户可以通过命令行传递截图或草图给模型,并结合本地代码进行推理,具备代码生成、运行、重构、测试、正则解析、数据库迁移、文件管理等多项功能,该工具已在GitHub 完全开源,提供“建议模式”(提出命令供用户确认)和“全自动模式”(禁用网络访问)两种运行模式,兼顾安全与效率。

我们认为OpenAI 的产品发布代表了AI 发展的“多模态推理”和“Agent 能力提升”两大趋势,也为开源模型的开发方向做了指引,在应用侧利好更多场景落地:1)游戏行业代码与美工需求量大,AI图像理解和Agent 能力的提升有望提升效率、创新产品形式,推荐恺英网络、姚记科技,受益标的巨人网络;2)教育领域对图像理解的要求较高,相关能力提升将在辅助教育、内容生成方面带来帮助,受益标的南方传媒、中原传媒、皖新传媒、世纪天鸿;3)营销电商可借助agent 能力提升营销决策、素材生成等方面效果,推荐美登科技,受益标的因赛集团、迈富时。

风险提示:国内外AI 效果不及预期,相关行业政策风险。

免责声明:以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈