本报告导读:
OpenAI 发布o3 和o4-mini 模型,首次将图像直接融入思维链,工具调用能力也有显著增强,提升了 AI完成复杂任务的能力,有望在游戏、教育、营销等领域应用。
投资要点:
事件:OpenAI 于 4 月 16 日发布推理模型 o3 和 o4-mini,以及开源的轻量级终端编程智能体Codex CLI。
o3 与o4-mini 在图像深度思考和工具调用方面表现突出。作为o 系列目前最智能的推理模型,模型首次将图像直接融入思维链,借助图片进行“思考”,且可以配合python 数据分析、网络搜索、图像生成等工具应对复杂任务,如上传照片、手写稿等场景下,即便图像模糊、倒置、质量不佳,也能准确识别并调用工具完成旋转、裁剪等操作。两款模型中,o3 推理能力更强、适合复杂分析场景,输入/输出每百万tokens 分别为10 美元和40 美元,相对上一代对标的o1 成本下降了1/3(o1 定价分别为15 和60 美元);o4-mini 以更低成本提供高效性能,输入/输出每百万tokens 的价格分别为1.1/4.4美元,与o3-mini 持平。
OpenAI 推出的Codex CLI 是基于o3 和o4 Mini 的轻量级终端编程Agent,已在GitHub 开源。Codex CLI 基于o3 和o4-mini 的推理能力,支持多模态输入,用户可以通过命令行传递截图或草图给模型,并结合本地代码进行推理,具备代码生成、运行、重构、测试、正则解析、数据库迁移、文件管理等多项功能,该工具已在GitHub 完全开源,提供“建议模式”(提出命令供用户确认)和“全自动模式”(禁用网络访问)两种运行模式,兼顾安全与效率。
我们认为OpenAI 的产品发布代表了AI 发展的“多模态推理”和“Agent 能力提升”两大趋势,也为开源模型的开发方向做了指引,在应用侧利好更多场景落地:1)游戏行业代码与美工需求量大,AI图像理解和Agent 能力的提升有望提升效率、创新产品形式,推荐恺英网络、姚记科技,受益标的巨人网络;2)教育领域对图像理解的要求较高,相关能力提升将在辅助教育、内容生成方面带来帮助,受益标的南方传媒、中原传媒、皖新传媒、世纪天鸿;3)营销电商可借助agent 能力提升营销决策、素材生成等方面效果,推荐美登科技,受益标的因赛集团、迈富时。
风险提示:国内外AI 效果不及预期,相关行业政策风险。



