行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递

云天励飞陈宁:英伟达LPX是AI推理时代加速到来的风向标

上海证券报 03-17 17:27

上证报中国证券网讯当地时间3月16日,英伟达GTC2026在美国加州圣何塞召开。与以往发布单芯片不同,英伟达本次发布了一个包含7款全新芯片的“全家桶”系统——Vera Rubin AI算力平台,包含Rosa CPU、Rubin GPU、NVLink 7 Switch、ConnectX-10 SuperNIC、BlueField-5 DPU、Spectrum-X以太网硅光交换机及LPX系列语言处理单元LPU芯片(基于Groq技术)。

“最大的亮点是,英伟达释放出一个明确的信号:AI推理时代正在加速到来。推理芯片比拼的不再仅是峰值参数,而是能否围绕真实负载做更细颗粒度的异构优化,把每一份算力都尽可能用在刀刃上。”谈及英伟达本次发布会,云天励飞董事长兼CEO陈宁在接受上证报记者采访时表示,英伟达LPX是AI推理时代加速到来的风向标。

陈宁表示,随着Agentic AI从“会对话”走向“会做事”,大模型正在越来越深地嵌入真实工作流。而一旦AI真正进入生产环节,行业最关心的问题就不再只是“模型够不够强”,而是“算力够不够划算、账能不能算得清”。要做到这一点,关键并不只是继续堆通用算力,而是要让硬件更充分地贴合不同任务的真实需求,尽量减少冗余和浪费。

在演讲中,黄仁勋解释了引入LPU的战略考量:在AI智能体时代,推理需求正加速分化。面对需要极高交互性、超短响应时间的任务,传统GPU架构存在性能冗余。为此,英伟达引入专为“极致低延迟Token生成”设计的LPU架构,弥补GPU在推理后段的冗余与延迟。

陈宁表示,AI推理时代要追求极致性价比,越来越需要异构计算,针对推理计算过程中计算负载的特征进行细分,让不同硬件分别承担更适合的工作,从而把系统整体效率推到更高。这也是近期国内AI推理芯片厂商的技术路线愈发被关注的原因。

记者注意到,为让架构设计更贴近真实推理负载,以更高性价比支撑大模型落地,云天励飞已经公开提出GPNPU技术路线,并围绕大模型推理场景提出PD分离的系统架构思路,规划推出P芯片与D芯片,分别面向prefill与decode的不同需求展开优化;同时,公司也公开提到,通过3D堆叠存储与软硬协同设计,优化推理链路中的带宽与时延瓶颈。

其中,P芯片适用于AI推理的前段任务prefill(前段预填充),通常涉及大量并行计算,芯片需具备高并行算力、大内存容量和高吞吐;D芯片则负责推理任务的后段decode(解码),更看重低时延、低抖动和快速响应。

在业内人士看来,英伟达在GTC2026上推出的Rubin GPU+LPX(LPU)就是面向AI推理的prefill(高并行、高吞吐)和decode(极致低时延Token生成)两个阶段。与英伟达的“推理异构化”一样,云天励飞围绕GPNPU、PD分离、3D堆叠存储构建的推理芯片架构,具有“异曲同工”之妙。

陈宁表示,随着行业竞争从“比训练规模”逐步转向“比推理效率、比交付成本、比系统赚钱能力”,谁能更早把硬件、存储和软件协同做到位,谁就更有机会在推理时代占据主动。

免责声明:用户发布的内容仅代表其个人观点,与九方智投无关,不作为投资建议,据此操作风险自担。请勿相信任何免费荐股、代客理财等内容,请勿添加发布内容用户的任何联系方式,谨防上当受骗。

举报

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈