【行业洞察】Token经济加速形成 Token工厂蓄势待发
【摘要】 “Token经济”正加速形成。去年至今,由于国产模型能力的快速迭代、C端AI应 用的迅速普及,以及智能体应用的异军突起,国内token消耗量大幅增加,根据国 家数据局统计,2024年初国内日均Token调用量为1000亿、2025年底跃升至100 万亿,而到2026年3月已经突破140万亿,两年增长超千倍。而Token消耗量的 大幅增长,以及智能服务采取按Token计费的模式,使得围绕Token生产、调用、 计量、核算和价值转化的“Token经济”正在加速成型。“Token工厂”是“Token经济”的核心生产环节,国内企业已开启“Token工厂”业务模式落地,相信“Token运营商”也会逐步涌现。 |
【正文】
Token工厂由英伟达黄仁勋在GTC 2026大会提出,是以大规模GPU算力集群为底座,整合电力、液冷、高速网络与大模型推理优化技术,工业化、标准化量产AI Token(词元)的新型算力基础设施。词元是大模型处理文本/图像/语音的最小语义单位(1个 Token≈1 个英文单词 / 1-2 个汉字),是 AI 时代的 “智能基础货币”,可计量、定价、交易。Token 工厂本质是把电力 + GPU 算力 + 模型打包,工业化、规模化生产 AI 推理 Token,并按 “Token 数量 + 质量” 直接计费的新型算力基础设施;核心是从卖“算力/卡时”转向卖“智能单元 Token”,边际成本趋近零、毛利显著更高。
图:token工厂VS传统算力租赁 |
|
来源:九方金融研究所 |
Token工厂以算-电-热-网深度协同为架构,将电力、芯片、数据、算法转化为标准化Token 输出的 AI 基础设施;核心指标是Token吞吐量(每瓦产出Token数)与单位Token成本。
Token工厂由四大模块构成:
(一)硬件底座(生产车间)
算力集群:英伟达 H100/H200 为主(占成本 60%-70%),搭配 AMD MI300X 国产替代;单工厂需万卡级 GPU 规模支撑量产。
散热系统:液冷(冷板式 / 浸没式)为主,PUE≤1.2(传统 IDC PUE=1.5-2.0),电力成本占比降至 50% 以下。
电力保障:优先绿电(风电 / 光伏 / 水电) 或低价工业电,电力成本占总成本 50%-70%,是核心成本变量。
高速网络:200G/400G IB 网络 + ROCEv2 协议,降低 Token 调度延迟,支撑每秒亿级 Token 吞吐。
(二)模型层(生产工艺)
基础模型:接入自研 / 第三方大模型(通用如 GPT-4o、文心一言;行业专用如金融 / 医疗模型)。
推理优化:量化(INT4/INT8)、稀疏化、批处理、KV 缓存优化,提升 Token 产出效率 3-5 倍,降低单位成本。
(三)调度运营系统(生产管理)
算力调度:动态匹配模型负载与 GPU 资源,GPU 利用率 > 90%(传统算力仅 60%-70%)。
能耗管理:智能配电 + 液冷温控,实时优化 PUE,最大化“Token / 瓦”产出。
监控计费:实时监控 Token 产量、延迟、错误率,对接API网关,按用量自动计费/分成。
(四)生态合作体系(销售渠道)
算力运营方:提供算力+电力+运维,分成比例 60%-70%(核心受益);
模型方:提供大模型,分成比例 20%-30%;
应用方:对接C端/B端客户(AI 聊天、内容生成、企业服务),分成比例 10%-20%。
2026年3月中国日均Token调用量达140万亿,较2024年初1000亿增长超1000倍,2030年全球消耗量复合增长率超 3000%。
“Token 工厂”盈利能力往往较高,“Token 运营商”流水高、毛利率相对低。伴随着 AI 推理需求的大幅增长,Token 工厂和 Token 运营商行业均涌现出迅速发展的独角兽公司。Token 工厂方面,2022 年成立的 Fireworks AI 据估在 2026 年 2 月达到 3.15 亿美金年化收入、毛利率约 50%左右,上一轮融资估值为 40 亿美金,而全球最知名的“Token 运营商”--OpenRouter 的商业模式为按充值金额收入5.5%左右的平台费,其平台目前聚合了 60+供应商、400+模型、800 万+用户,最新月Token 服务量为 80 万亿左右,其最新一轮融资可能会按照 13 亿美金的估值来推进。国内三大运营商以及润建股份、范式智能等国内企业均已开启“Token 工厂”业务模式落地,相信“Token 运营商”也会逐步涌现。
Token工厂产业链相关公司:
AIDC 机房:光环新网(字节跳动 Token 核心合作伙伴)、大位科技、奥飞数据、新意网集团、润泽科技、宝信软件;受益标的:东阳光、数据港、万国数据、世纪互联等;
CDN:网宿科技等;
AIDC 计算和网络。推荐标的:中际旭创、新易盛、华工科技、盛科通信、亨通光电、中天科技、中兴通讯、紫光股份、欧陆通、天孚通信;受益标的:寒武纪、海光信息、华勤技术、浪潮信息、锐捷网络、长飞光纤光缆、长飞光纤、烽火通信等。
参考研报
20260319-开源证券-重视“Token工厂”三大投资主线
免责声明 本报告仅提供给九方金融研究所的特定客户及其他专业人士,用于市场研究、讨论和交流之目的。 未经九方金融研究所事先书面同意,不得更改或以任何方式传送、复印或派发本报告的材料、内容及其复印本予以任何第三方。如需引用、或经同意刊发,需注明出处为九方金融研究所,且不得对本报告进行有悖于原意的引用、删节和修改。 本报告由研究助理协助资料整理,由投资顾问撰写。本报告的信息均来源于市场公开消息和数据整理,本公司对报告内容(含公开信息)的准确性、完整性、及时性、有效性和适用性等不做任何陈述和保证。本公司已力求报告内容客观、公正,但报告中的观点、结论和建议仅反映撰写者在报告发出当日的设想、见解和分析方法应仅供参考。同时,本公司可发布其他与本报告所载资料不一致及结论有所不同的报告。本报告中的信息或意见不构成交易品种的买卖指令或买卖出价,投资者应自主进行投资决策,据此做出的任何投资决策与本公司或作者无关,自行承担风险,本公司和作者不因此承担任何法律责任。 投资顾问:吴清淳(登记编号:A0740622030004) |
免责声明:以上内容仅供参考学习使用,不作为投资建议,此操作风险自担。投资有风险、入市需谨慎。
推荐阅读
相关股票
相关板块
相关资讯
扫码下载
九方智投app
扫码关注
九方智投公众号
头条热搜
涨幅排行榜
暂无评论
赶快抢个沙发吧