行情中心 沪深A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

市场接纳“杰文斯悖论”! DeepSeek掀起“效率革命” AI芯片需求仍是星辰大海

来源:智通财经 2025-02-19 15:05
点赞
收藏

来自中国的AI初创公司DeepSeek在周二最新公布的原生稀疏注意力(Native Sparse Attention, 简称NSA)机制,不仅将大语言模型处理64k长文本的速度最高提升11.6倍,更在通用基准测试中实现性能反超传统全方位注意力机制模型,意味着AI大模型不久后有望在愈发精简架构的基础上性能也能实现大幅增长,AI训练与推理成本则有望在DeepSeek R1基础上继续呈现大幅下降态势。

继开发出兼具“低成本”与“高性能”属性的DeepSeek R1开源大模型震撼硅谷与华尔街之后,这家非常低调的中国AI初创公司继续展示出基于革新“软件工程技术”破局美国AI算力芯片封锁的全新“极低成本AI大模型算力范式”。

值得投资者们注意的是,关于NSA机制的这份DeepSeek最新研究报告出炉后,英伟达、Marvell、台积电、世芯以及港股市场的中芯国际华虹半导体等AI芯片产业链热门股的股价并没有因“AI训练与推理成本大幅下行+计算效率激增”而出现类似1月27日的芯片股全线暴跌,反而其中一部分出现强势上涨,尤其是港股芯片标的。

与AI密切相关的芯片股集体股价坚挺背后的核心逻辑,无疑在于市场并未像1月27日那样定价AI训练与推理效率飙升带来的短中期AI芯片需求下滑预期,而是已经充分接纳微软CEO纳德拉此前提到的“杰文斯悖论”——当技术革新大幅提高效率,资源消耗不仅没有减少,反而激增,移植到人工智能算力领域则是AI大模型应用规模激增趋势将带来的史无前例AI推理算力需求。

这也是为何华尔街金融巨头摩根士丹利在最新研报中,重申对于AI芯片两大核心技术路线——AI GPU与AI ASIC核心股票标的的强烈看涨预期,并且强调亚马逊、谷歌与微软等大型科技公司坚持AI资本支出大幅扩张也是基于未来应用端AI算力需求激增,尤其是云端AI推理算力需求激增。

也就是说,DeepSeek虽然彻底掀起AI训练与推理层面的“效率革命”,推动未来AI大模型开发向“低成本”与“高性能”两大核心聚焦,而不是疯狂烧钱用“大力出奇迹”方式训练人工智能大模型。但是,AI应用渗透至全球各行各业的天量级AI推理算力需求意味着,AI芯片需求的未来仍将是星辰大海。

据了解,DeepSeek团队提出的原生稀疏注意力机制(NSA)通过动态分层的稀疏策略,将传统全密集Attention(O(n²)复杂度)的计算负担大幅降低。NSA采用了三个并行分支(压缩注意力、选择注意力、滑动窗口注意力),并通过门控融合各分支输出,实现了训推一体化的高效计算。这一创新设计不仅使长文本处理任务中推理速度最高可提升11.6倍,还显著降低了训练时对愈发庞大AI GPU算力基础设施的依赖程度,从根本上改善了AI算力资源的利用率。

相比之下,Facebook的Llama、OpenAI的o3mini和谷歌Gemini则各自采用了不同的近似计算策略或硬件调优策略,这些差异值决定了在长序列处理、算力基础设施的能耗优化和AI部署灵活性方面,DeepSeek NSA机制具有强大得多的竞争优势。

随着DeepSeek重磅推出的DeepSeek R1继续风靡全球,以及DeepSeek公司的最新研究显示的NSA机制在Transformer底层实现AI大模型革命性训练与推理效率提升,引发全球AI大模型开发者追随这种“极低成本AI大模型算力范式”,进而全面驱动AI应用软件(尤其是生成式AI软件与AI代理)向全球各行各业加速渗透,彻底革新各业务场景的效率并大幅提高销售额,AI芯片需求在未来可能呈现指数级增长而不是此前市场所预期的“DeepSeek冲击波”引发AI芯片需求断崖式下滑。

AI芯片两大路线——AI GPU与AI ASIC,大摩都相当看好

摩根士丹利在研报中指出,在特朗普政府支持下所开启的星际之门项目(即Stargate项目),以及DeepSeek R1大模型横空出世之后中国各行各业积极接入与部署DeepSeek大模型所带来的庞大AI推理算力需求推动之下,AI GPU与AI ASIC需求前景展望可谓极度乐观。

大摩在这份研报中重申对于AI GPU绝对领军者英伟达(NVDA.US)的“增持”评级,以及对于中国台湾的封测巨头京元电子(KYEC)、AI ASIC领军者世芯电子(Alchip)与创意电子(GUC),全球芯片代工之王台积电(TSMC)的“增持”评级。

关于AI GPU,大摩表示,DeepSeek推动中国大型科技企业的AI资本支出激增。大摩团队从台湾半导体供应链获悉,2025年第一季度大约75万颗Hopper架构英伟达AI芯片——集中于专为中国市场推出的H20,将由京元电子(KYEC)完成测试。

大摩表示,受NVL72组装瓶颈影响,英伟达的客户们正积极转向采用B200 AI芯片的HGX服务器(8-GPU架构)。例如,Coreweave与xAI等CSP客户要求ODM厂商在单机架内部署8台HGX服务器(即总计64颗B200 AI GPU)。大摩预计B200芯片库存可被消化,无需下调台积电CoWoS产能预测,并且预计2025年下半年,采用新型连接器设计的GB300 Cordelia模块将显著改善系统良率。

大摩的半导体供应链调查还显示,鉴于Blackwell与Hopper需求强劲,英伟达今年上半年有望实现与市场乐观预期相符的业绩。大摩表示,鉴于英伟达AI GPU仍然需求无比强劲,维持该机构对于CoWoS需求46.5万单元的乐观预期,但假设更多CoWoS产能将来自台积电CoWoS-L先进封装。

关于ASIC,大摩表示,北美金融市场的ASIC投资热度边际过热,相比之下亚洲地区的ASIC厂商们在定制化芯片领域具备估值优势,且与亚马逊AWS等大厂关联的ASIC项目有望带来强劲业绩。大摩表示,从供应链观察到亚马逊AWS正将其对于台积电的CoWoS产能预订从Trainium2(由Marvell代工)逐步转向Trainium3(由世芯进行代工)。

在1月下旬,OpenAl、软银联合甲骨文宣布了一项名为“星际之门”(Stargate)的超大规模AI基础设施建设计划,初期投资额为1000亿美元,4年之内最高可扩大至5000亿美元,集中于新建设以及扩建AI数据中心。“星际之门”的5000亿美元投资计划远超市场预期,甚至被一些媒体誉为“新时代的曼哈顿计划”。重返白宫的美国总统特朗普表示,美国政府将通过紧急声明为“星际之门”计划提供所有便利,尤其是满足必要的全部电力/能源需求,甚至迫切需要的土地/建筑许可。

随着DeepSeek引领的“低成本算力新范式”席卷全球,AI训练与应用推理端AI成本愈发下行,同时全面驱动AI应用软件(尤其是生成式AI软件与AI代理)向中国各行各业加速渗透,有望彻底革新各业务场景的效率并大幅提高SaaS软件以及云计算销售额,而这无疑将带来无比庞大的云端AI推理算力需求。DeepSeek接入微信之后经常见到DeepSeek深度思考无法响应客户需求,验证了当前中国市场的AI算力基础设施远远无法满足AI算力需求。

AI芯片需求的核心支柱——美国科技巨头们巨额支出+星际之门

大摩在研报中指出,美国科技巨头们在2025年的巨额资本支出预期,以及“星际之门”项目计划未来四年投资5000亿美元,其中1000亿美元将于当前部署,使得英伟达AI GPU,以及ASIC厂商们所推出的AI ASIC需求仍然非常强劲,加之DeepSeek大模型加速渗透至中国各行各业所带来天量AI推理需求,将点燃AI芯片产业链的新一轮需求狂潮。

大摩上调2025年北美云计算大厂们整体支出预期,增速从此前的同比29%预期上调至32%,也就是说2025年北美前十大云服务巨头资本支出预计将达3500亿美元,主要基于云端AI推理算力需求大幅扩张趋势。大摩通过半导体供应链观察到,“星际之门”项目的部分GB200 NVL72订单通过戴尔承接,潜在订单可能通过甲骨文及其亚洲ODM/OEM伙伴,比如FII来执行。

微软亚马逊、谷歌以及Meta,乃至生成式AI领军者OpenAI,从这些巨头近期财报或者行业动态看出,无一例外都在联手博通或者Marvell自研AI ASIC芯片,用于海量推理端AI算力部署。因此AI ASIC未来市场份额扩张之势有望大幅强于AI GPU,进而趋于份额对等,而不是当前AI GPU一家独大局面——占据AI芯片领域高达90%份额。

但是,这种转变不是一蹴而就,在当前AGI仍处于研发进程,AI GPU的灵活性与通用性仍然是AI训练最倚重的专属能力。超大规模的AI模型,比如GPT家族与LIama开源家族,在“研究探索”或“快速迭代”阶段对算子灵活性、网络结构可变性的需求依旧很高——这是通用 GPU 仍占据优势的主要原因。

在谷歌与Meta业绩电话会议上,皮查伊以及扎克伯格均表示将加大力度携手芯片厂商博通推出自研AI ASIC,这两大巨头的AI ASIC技术合作伙伴都是定制化芯片领域领军者博通,比如谷歌联手博通打造的TPU(Tensor Processing Unit)就是一种最典型的AI ASIC。Meta此前与博通共同设计了Meta的第一代和第二代AI训练/推理加速处理器,预计Meta与博通将在2025年加快研发Meta下一代AI芯片 MTIA 3。获得微软巨额投资以及达成深度合作的OpenAI去年10月表示,将携手博通开发OpenAI首款AI ASIC芯片。

随着大模型架构逐渐向几种成熟范式收敛(例如标准化的 Transformer 解码器、Diffusion 模型流水线),ASIC可以更容易地吃下主流推理端算力负载。并且某些云服务商或行业巨头会深度耦合软件栈,让 ASIC兼容常见的网络算子,并提供优秀的开发者工具,这将加速 ASIC 推理在常态化/海量化场景中的普及。

展望未来算力前景,英伟达AI GPU可能更多专注在超大规模前沿探索性的训练、变化极快的多模态或新结构快速试验,以及 HPC、图形渲染、可视分析等通用算力。AI ASIC则聚焦于深度学习特定算子/数据流做极致优化,也就是擅长稳定结构推理、批量高通量、高能效比。比如,如果一家云平台的AI工作负载中大量使用针对 CNN/Transformer 中常见算子(比如矩阵乘法、卷积、LayerNorm、Attention等),大多AI ASIC会针对这些算子做深度定制;图像识别(ResNet系列、ViT)、基于Transformer的自动语音识别(Transformer ASR)、Transformer Decoder-only、部分多模态流水线固定化后,都可以基于ASIC进行极致优化。

就像大摩在此前的一份研究中预测的那样,长远来看,两者将和谐共存,中期左右AI ASIC市场份额有望大幅扩张。英伟达通用GPU将聚焦于复杂多变场景与前沿研究,ASIC 聚焦高频稳定、大规模的AI推理负载以及一部分成熟稳定的固化训练流程。

(来源:
智通财经)
原标题:
市场接纳“杰文斯悖论”! DeepSeek掀起“效率革命”,AI芯片需求仍是星辰大海

免责声明:本页所载内容来旨在分享更多信息,不代表九方智投观点,不构成投资建议。据此操作风险自担。投资有风险、入市需谨慎。

举报

写评论

声明:用户发表的所有言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。《九方智投用户互动发言管理规定》

发布
0条评论

暂无评论

赶快抢个沙发吧

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈