行情中心 沪深A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

电子元器件行业:昇腾超节点释放单卡性能 昇思迭代增强软硬协同

国泰海通证券股份有限公司 04-19 00:00

本报告导读:

CloudMatrix 384 超节点单卡性能对标H100,昇思Mindspore 2.6 全面支持类Deepseek V3/R1 MOE架构模型,国产算力芯片预计加速渗透。

投资要点:

投资建议。C loudMatrix 384 超节点发布,其采用新型高速总线升级互联带宽,单卡decode 吞吐对标H100。昇思Mindspore 2.6 全面支持类Deepseek V3/R1 MOE 架构模型,系统吞吐率提升2.8 倍。伴随硬件性能提升与软件架构迭代,国产AI 算力芯片需求有望加速增长。推荐标的:中芯国际、华丰科技、兴森科技、芯碁微装。

硬件:CloudMatrix 384 超节点发布,国产AI 算力基础设施升级。

根据2025 年4 月10 日举办的华为云生态大会,CloudMatrix 384 超节点采用新型高速总线,通过统一内存编制、通信升级互联带宽,有效提升推理性能。根据硅基流动微信公众号,384 超节点可在单用户20TPS 前提下,实现单卡decode 吞吐1920 tokens/s,与H100性能相当。并且CloudMatrix 384 超节点高速互联带宽有望加速国产算力卡向训练场景突破。

软件:昇思发布Mindspore 2.6,加速开发大模型一体化部署方案。

根据2025 年4 月12 日举办的昇思开发者大会,MindSpore 2.6 全面支持类Deepseek V3/R1 MOE 架构模型:(1)支持高性能MOE 预训练,性能提高30%;(2)发布新的后训练学习套件GRPO 等,支持deepseek,千问等模型的GRPO 训练以及DRO/PPO 等算法,支持训推一体;(3)适配支持vLLM 原生接口,支持Deepseek V3/R1 Int8量化,新增10+推理融合大算子,系统吞吐率提升2.8 倍。并且昇思联合北大、openeuler 提供大模型一体化软件方案,整合deepseek、Mindspore、openeuler、VLLM 开源组件,支持大模型快速部署服务。

未来昇思生态将持续演进,预计Mindspore 2.7 将支持大EP 并行能力,实现多模态生成模型Day0 迁移,将进一步加速Altas 800 A3 超节点推理速率。

催化剂:CloudMatrix 384 超节点量产落地

风险提示:昇腾芯片性能测试不及预期;下游客户缩减AI capex

免责声明:以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈