行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

开源证券:ChatGPT推出新功能!多模态AI加速突破

2023-09-26 17:09

事件:ChatGPT推出语音和图像功能

9月25日,OpenAI在官网发文表示在ChatGPT推出语音和图像功能,未来两周将向Plus和Enterprise用户推出,语音功能支持iOS和Android平台,图像功能支持全平台。

(1)语音功能:用户可以与ChatGPT进行语音对话,让ChatGPT讲故事、读诗等。语音输入端,由开源语音识别系统Whisper将口语转录为文本;语音输出端,由新的文本转语音模型支持,可以从文本和几秒的语音样本中生成类似人类的音频。

(2)图像功能:用户可以用图片向ChatGPT提问,支持多轮对话和多图识别,比如拍下冰箱照片询问ChatGPT晚餐吃什么。从OpenAI官网展示的应用案例来看,ChatGPT可以根据用户上传的自行车、说明书、工具箱照片,指引用户完成自行车座椅的调节。

谷歌和OpenAI持续加码,多模态AI加速突破

在5月的I/O大会上,谷歌推出对标GPT-4的大模型PaLM2,同时表示未来研究重心正转向多模态的Gemini。9月20日,OpenAI宣布推出新版文生图AI工具DALL-E3,DALL-E3通过集成ChatGPT能力实现多项升级。此前,根据TheInformation报告,OpenAI即将推出多模态大模型GPT-vision。谷歌、OpenAI等科技巨头纷纷加码,多模态AI加速突破。

多模态大模型推动AI迈向“通感”时代,算力需求将大幅提升

随着人工智能感知、交互和生成能力的快速发展,多模态大模型正推动人工智能迈进“通感”时代,应用场景和生态也将进一步丰富。语音和图像数据大小显著高于文本,多模态大模型训练和推理的算力需求将大幅提升。根据SemiAnalysis表示,谷歌下一代多模态大模型Gemini已开启训练,算力达到1e26FLOPS,是训练GPT-4算力的5倍。孟晚舟在2023华为全球分析师大会上表示,预计到2030年通用计算能力将增长10倍,AI计算能力将增长500倍,AI算力有望持续高景气。

投资建议

龙头推荐金山办公科大讯飞同花顺三六零等。应用领域,推荐鼎捷软件彩讯股份焦点科技拓尔思致远互联等,受益标的包括泛微网络普元信息汉仪股份新致软件福昕软件万兴科技汉得信息等。底层算力领域,服务器端推荐中科曙光浪潮信息,受益标的包括紫光股份等;GPU端,推荐海光信息,受益标的包括寒武纪、景嘉微等;华为昇腾生态,推荐卓易信息神州数码等,受益标的包括四川长虹烽火通信拓维信息同方股份等。AI监管领域,受益标的包括美亚柏科永信至诚人民网等。

风险提示:AI落地不及预期;市场竞争加剧风险;公司研发不及预期风险。

(来源:开源证券)

免责声明:以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

举报

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈