本报告导读:
市场低估了DeepSeek 生态对算力需求的放大效应,我们预计仅其推理端就将产生近百万PFLOPS 的算力需求。精度支持及通信效率率先突破的国产AI 芯片厂商将获得显著的发展机会。
投资要点:
投资建议:DeepSeek 的技术突破虽然短期内引发市场对高端 AI 芯片需求的担忧,但通过降低准大模型训练准入门槛扩大了整体市场规模。首先受益的是国产算力芯片厂商,特别是华为昇腾等已经在推理性能上接近国际水平的企业,将借助性价比优势在企业级部署市场获得突破。随着企业级部署需求增长,算力租赁商将迎来增长,大量中小企业会选择更灵活的租赁方案来降低初始投入。当大模型部署成本降低到一定水平后,终端设备推理算力需求将显著提升,驱动端侧AI 芯片市场扩容。推荐标的:紫光股份、浪潮信息、科大讯飞,受益标的:云从科技、拓维信息、神州数码、中科曙光。
DeepSeek 的低成本突破实际上通过降低准入门槛扩大了市场规模,进一步推动了AI 民主化进程。DeepSeek-V3 以557.6 万美元的训练成本刷新了大语言模型的经济性基准,一度引发市场对高端AI 芯片的必要性的质疑。然而,从DeepSeek 技术创新的角度以及持续攀升的AI 算力需求,我们重新认识到:降低单次训练成本的技术突破不仅没有减少市场对高性能AI 芯片的需求,反而通过降低准入门槛以及催生海量推理需求而扩大了市场规模。根据我们测算,DeepSeek 生态或将产生近百万PFLOPS 级别的推理算力需求,对应每年超过千亿元的算力租赁市场。
DeepSeek 生态的崛起为国产AI 芯片提供了前所未有的替代机遇,华为昇腾等国产芯片厂商有望在这一浪潮中抢占市场份额。华为昇腾910B 在训练时效率已达到A100 的80%,910C 在DeepSeek 实测中AI 推理性能已达到H100 的60%左右。DeepSeek 从第一天起就支持华为昇腾芯片,并自主维护PyTorch 仓库,使开发者只需一行代码就能将CUDA 转换为CUNN。DeepSeek 全系列模型正式上线昇腾社区Model Zoo,同时,基于昇腾AI 硬件与昇思MindSpore AI框架的DeepSeek-V3 已完成开发支持并上线开源社区,这种深度的生态融合为华为在企业级AI 市场的拓展提供了重要支撑。
国产AI 芯片在精度支持和通信效率等关键技术维度仍需突破,但长期发展前景广阔。目前国内厂商在FP8/FP64 精度支持和芯片间高效通信等方面与国际领先产品存在差距。但随着DeepSeek 等国产大模型带来的市场机遇,以及国内厂商在软硬件协同优化方面的持续投入,国产AI 芯片有望在特定场景实现突破。特别是在企业级市场,凭借性价比优势和本地化部署能力,国产芯片厂商将迎来重要的市场机遇,有望在新一轮产业变革中占据重要地位。
风险提示:推理算力需求不及预测,精度支持等技术瓶颈突破缓慢,技术供应受限,CUDA 生态替代进程不及预期。



