行业近况
3 月19 日,英伟达召开GTC大会1,发布了初代Blackwell系列GPU、GB200 超级芯片及基于此的机架级系统GB200 NLV72,散热方式由风冷型向液冷型转变。我们认为,液冷作为散热效率更高的方式,凭借提升算力部署密度及降低系统功耗的优势,有望实现对传统风冷的替代,伴随AI算力规模增长实现高速增长。
评论
液冷散热赋能高计算密度,渗透率提升为大势所趋,行业加速落地。我们看到,英伟达在计算节点中引入液冷散热,赋能高计算密度,GTC大会发布的GB200 NVL72 能够实现720 petaflops 的AI训练性能及1,440petaflops 的推理性能,由18 个Tray组成,每个Tray均包含2 块 GraceCPU及4 块 Blackwell GPU并配置液体冷却;此外,联想集团、紫光股份、曙光数创等厂商也在持续丰富产品矩阵,加速落地液冷方案。我们认为,此次英伟达液冷散热的引入有望成为里程碑,印证液冷技术优越性的同时也提升了市场对于液冷落地节奏及潜在市场空间的预期。
液冷散热具备高散热效率的优势,有助于提升单机柜的功率密度。相较于传统的风冷散热,液冷散热的优势在于:1)在散热效率方面,根据赛迪顾问数据,冷却设备在数据中心总能耗中的占比为33%,液冷散热通过液体直接吸收并带走GPU等算力硬件产生的热量,能够提升散热效率从而降低总能耗;2)在计算密度方面,由于液冷散热无需为风扇等预留大量空间,允许高密度部署计算单元,减少占地面积,此外更紧凑的硬件布局也有利于缩短计算单元之间的物理距离,降低信号传输延迟。根据英伟达GTC,以90 天训练参数量为1.8T的GPT-MoE模型为例,若采用H100,则需要8,000 张卡,消耗功率为15MW;若采用GB200 NVL72,仅需要2,000 张卡,消耗功率为4MW;据此我们测算GB200 NVL72 单机柜对应的消耗功率超100KW。我们认为,液冷散热凭借高散热效率及提升算力部署密度的优势,在AI算力规模及液冷渗透率提升的驱动下,有望实现快速增长。
估值与建议
维持我们所覆盖公司的盈利预测、评级及目标价不变。建议投资者关注液冷相关标的曙光数创(未覆盖)、高澜股份(未覆盖)、紫光股份、联想集团、工业富联、英伟达。
风险
算力芯片产品迭代及降本不及预期;液冷渗透率不及预期。