算力从训练走向推理,步入增长新周期。当前大模型训练数据量增长放缓、边际效益递减,训练算力逐步转向 “精耕细作”。随着大模型能力全面超越人类基准,应用边界持续拓展,叠加推理成本因技术优化出现断崖式下跌,进一步刺激了推理需求爆发,算力结构已开始向推理侧倾斜。展望未来,多模态交互带来推理密度指数级提升,Agent 的普及引发推理任务爆发增长,二者将成为推动推理算力非线性爆发的核心引擎,推理算力占比将持续攀升,成为算力增长的主要驱动力。
Agent 时代,底层算力架构与云服务模式迎来重塑。硬件层面,CPU 迎来价值重估,逐步从幕后的调度角色转向前台核心承载,成为处理高度分支化任务、承载海量KV-Cache 的最优载体,直接推动服务器向多核化、大内存规格迭代升级;与此同时,GPU 的性能瓶颈已从算力峰值转向显存带宽。云服务层面,商业模式从传统的资源租赁模式,加速向“MaaS(模型即服务)与Agent 编排”的全新范式跃迁;行业竞争核心也从单纯的算力规模比拼,转向工具链生态的综合构建。阿里云、百度云等头部厂商也纷纷开启涨价。云厂商正从基础资源提供商,加速转变为智能体生态的集成商与综合承包商。
存储架构创新成为新趋势。在推理AI 时代,算力中心核心挑战从之前的算力为主逐步转向存储与带宽效率,KV 缓存对存储架构提出新要求,存储架构的创新带来新机会。英伟达在 2026 CES 推出 ICMS AI 原生存储平台,新增 G3.5 闪存层优化 KV缓存管理,依托 BlueField-4 DPU 实现大容量与高速传输,多家存储厂商参与构建;其还推进 SCADA 计划提升存储效率,cuDF、cuVS 数据加速库获国外主流云平台采用,而国内星环科技也与英伟达合作研发 GPU 数据库,共同推动 AI 推理与数据处理降本增效。
。
算力进入推理时代,算力链各个环节有望不断受益,我们建议投资者关注芯片、云服务、IDC 等等领域标的。
芯片端(GPU&CPU):相关公司包括海光信息(688041,买入)、寒武纪(688256,未评级)、禾盛新材(002290,未评级);
云服务&IDC:相关标的为首都在线(300846,未评级)、东阳光(600673,未评级)、豫能控股(001896,未评级)、网宿科技(300017,未评级)、优刻得-W(688158,未评级)等;
服务器:相关标的为浪潮信息(000977,未评级)、中科曙光(603019,买入)、华勤技术(603296,买入)等;
数据库:相关标的为达梦数据(688692,未评级)、星环科技-U(688031,未评级)风险提示
AI 应用推进不及预期风险;
行业竞争加剧风险;



