行情中心 沪深A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

系列一DEEPSEEK的创新:DEEPSEEK 开源低成本模型引发行业巨震

国泰君安证券股份有限公司 02-03 00:00

本报告导读:

DeepSeek 具备出色性价比,全球用户规模快速增长。其蒸馏小模型将驱动端侧AI落地,与昇腾云合作加速国产AI 生态闭环。

投资要点:

投资建议。DeepSeek R1 具备优异性价比,其蒸馏所得小模型推理性能优越,将加速端侧AI 落地。目前硅基流动推出基于昇腾云的DeepSeek R1&V3 推理服务,有望引领国产AI 算力、AI 芯片技术生态、AI 大模型闭环,国产算力产业链及端侧硬件有望受益。推荐标的:中芯国际、华丰科技,受益标的:中兴通讯、联想集团、申菱环境、泰嘉股份。

DeepSeek R1 API 定价最低仅为1 元/百万tokens,性能对标O1 模型,霸榜苹果应用商店140+国家/地区免费应用第一名。根据Deepseek 官网,Deepseek R1 API 服务定价为0.14 美元/百万输入tokens(缓存命中),2.19 美元/百万输出tokens。其在逻辑、数学及中文任务中表现出色,性能优于GPT-4o、O1-mini 等模型。优异性价比驱动用户数量快速增长,上线18 天日活即破1500 万,增速达Chatgpt 13 倍,并且霸榜苹果应用商店140+国家/地区免费应用第一名。未来用户数量有望加速提高,带动DeepSeek 服务器算力需求增长。

多token 并行与FP8 训练提升V3 训练效率,强化学习提高R1 推理性能,R1 蒸馏驱动端侧小模型落地。DeepSeek V3:(1)首创无辅助损失负载均衡策略,避免专家负载失衡。(2)通过采用多token并行预测与FP8 混合精度训练,提高训练信号密度,提升模型推理能力,同时降低训练所需算力。(3)在训练框架中采用DualPipe 算法,减少流水线空泡,通过计算-通信重叠隐藏大部分通信延迟。

DeepSeek R1:通过引入冷启动数据微调DeepSeek-V3-Base 模型以及多阶段训练优化,其推理任务水平达到OpenAI-o1-1217。并且基于其高质量训练样本蒸馏所得的DeepSeek-R1-Distill-Qwen-7B,推理性能超越QwQ-32B-Preview。DeepSeek R1 蒸馏所得的高推理性能小模型将加速端侧AI 落地,驱动AI 手机、AI PC、AI 眼镜等硬件出货量上行。

海外巨头纷纷接入,昇腾云携手引领国产AI 闭环。基于出色的推理性能及低廉的使用成本,目前微软、英伟达、亚马逊等海外巨头已接入DeepSeek R1 API。硅基流动已推出基于昇腾云服务的DeepSeek 模型,其采用华为自研推理加速引擎,性能持平全球高端GPU 部署模型效果。昇腾云与DeepSeek 合作有望推动国产AI 芯片、AI 芯片技术生态与AI 大模型闭环,加速国产AI 算力生态自主可控。

风险提示。端侧模型落地进展不及预期;AI 技术迭代不及预期。

免责声明:以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈