Token称王!大厂的“护城河”变了
2026年3月,中国AI大模型的日均Token(词元)调用量突破140万亿。每秒燃烧超过16亿Token的AI赛道上,一场无声的“座次重排”正在发生,衡量科技公司竞争力的标准,流量不再是唯一的通行证——Token正在成为新的硬通货。
用户规模曾是移动互联网时代无可争议的护城河。腾讯手握超10亿微信月活,阿里覆盖超10亿消费者,字节跳动坐拥超8亿月活的抖音。只要“流量池”足够大,通过广告、电商、游戏、增值服务的变现水到渠成。
当AI从“聊天玩具”进阶为企业生产工具,基于流量的游戏规则变了。英伟达创始人黄仁勋认为,Token将是未来数字世界最核心、最值钱的大宗商品。
一组关键数据暗示格局生变:豆包大模型日均Token使用量突破120万亿,中国第一、全球第三;智谱MaaS API平台ARR(年度经常性收入)达17亿元,同比提升60倍,CEO张鹏直言“当模型足够强,API本身就是最好的商业模式”;DeepSeek理论成本利润率曾达545%。全球最大API聚合平台OpenRouter的最新榜单中,中国 AI 大模型全球调用量再创新高,前六名全部来自中国。
流量为王正在被Token为王的新秩序取代。
Token之战
作为全球日均Token消耗量超100万亿的三家公司之一,字节跳动的Token调用量已与OpenAI和谷歌巨头在同一梯队。相较两年前的数据,实现了1000倍的高速增长,火山引擎上万亿级Token消耗企业增至140家。
字节未透露Token消耗在内外部业务的比重。火山引擎总裁谭待告诉记者,Token消耗涨势快源于两个因素:一是视频创作,因为所有行业都有营销需求,视频是最好的载体,短剧、动画等内容细分领域的消耗也在快速提升。二是OpenClaw这类火爆的Agent产品。
他说,一年前大家还会按行业划分AI的应用,但现在OpenClaw类产品的普及让每个员工都能使用,有人用它做招聘,有人用它做市场分析,有人用它处理周报,已经无法单一定义它的应用场景。
但在Token大规模调用量中,包含了大量无效算力。谭待以解数学题为例:枚举法计算量大,模型能力不足就会采用类似方式,造成无谓消耗;更优秀的模型能找到简洁解法,优化空间很大。
相比字节在调用量上的领先,智谱、MiniMax、月之暗面等AI公司,没有云计算生态,也没有微信、抖音这样的C端超级入口,却展示了Token在To B市场的商业价值。
智谱2025年MaaS API平台ARR达17亿元,同比提升60倍,毛利率提升近5倍至18.9%。2026年Q1,智谱API涨价83%,调用量反而同比增长400%,实现“量价齐升”。
智谱张鹏提出了AI生产力价值的公式:TAC = 智能调用量 × 智能质量 × 经济转化效率。他认为,随着OpenClaw等应用驱动Token消耗进入指数级轨道,推理再中心化和高质量Token出海将成为趋势。
在这样的趋势下,Token逐渐成为AI服务的核心计价与流通单位,进而对现有各厂商的商业模式造成冲击与影响。
传统大厂们已经感受到压力。一个直观的信号是:从市值看,智谱与MiniMax已一度连超包括携程、快手、百度、京东等巨头。
在大模型世界里,用户体量并不天然导向Token消耗增长。Token消耗由使用频次和深度共同决定——一个重度AI开发者一天消耗的Token可能比1万个普通C端用户还多。用户忠诚度由模型效率、性价比和稳定性决定。传统互联网看 “流量密度”,AI 大模型看 “Token 密度”:Token 调用量,本质是算力、模型、场景、商业化的综合成绩单,比流量更能反映真实竞争力。
“云计算厂商是双重身份,一方面是大模型提供者,能生产Token;另一方面,独立大模型厂商生产Token需要大量算力,主要由云计算厂商提供。”腾讯集团副总裁、政企业务总裁李强告诉记者。
他感受到,过去一段时间主要需求方还是头部大模型公司、具身智能等,但OpenClaw推动AI从对话层走向执行层,将提振B端用户意愿,Agent能在合同审核、标书撰写、视频读取、内部审计等更多核心领域替代人工。AI to B已成为所有云厂商最大的增量市场。
Token消耗在云业务中的重要性也在上升。阿里CEO吴泳铭判断,未来MaaS收入将成为阿里云收入最多的产品。继阿里成立由吴泳铭挂帅的Alibaba Token Hub事业群,腾讯3月底也将MaaS平台升级为TokenHub。
不过截至目前,包括腾讯、阿里、百度在内的传统大厂Token数据仍很模糊甚至缺席。
谈及Token经济将对互联网厂商的行业壁垒产生差异化影响,沂景资本董事总经理对记者表示,核心影响范围集中于具备庞大云业务的头部互联网厂商。对于此类厂商而言,Token经济是其云业务不可或缺的核心组成部分,若无法构建完善的Token经济体系,其云业务的差异化竞争优势将逐步丧失,进而削弱整体行业壁垒;而对于滴滴、美团等无庞大云业务布局的互联网厂商而言,受限于业务属性与资源禀赋,Token经济并非其核心发展需求,亦无必要投入资源构建相关体系。
“从本质来看,Token经济的核心支撑并非单一算力,而是数据与算力两大核心要素的重资产持续投入,二者的协同布局构成了Token经济的核心壁垒,也是头部厂商维持竞争优势的关键。”上述人士表示。
Token数量不是唯一标准
Token正从大模型中的技术计量单位,跃升为智能经济的基础性价值尺度与结算工具,成为智能时代的价值锚点。
摩根大通预计,2025至2030年中国AI推理Token消耗量将从约10千万亿增至约3900千万亿,五年增长约370倍。DeepSeek此前公布的理论成本利润率高达545%,印证了Token经济在高效模型厂商手中的盈利潜力。
但Token数量不是衡量AI价值的单一标尺。
“大家千万不要觉得Token是相同的。”阿里云智能集团资深副总裁、公共云事业部总裁刘伟光对第一财经记者说。
同样一千个Token,用AI写搞笑文案或闲聊,与客服坐席用AI解决实际问题,创造的价值天差地别。前者更多是情绪价值,后者直接关联企业的降本增效。
一位从业者表示:如果一个模型用100句话、10万Token才讲完一件事,而先进模型只用五句话、一千个Token就解决——哪个价值更大显而易见。“企业为Token付费,本质上是为生产力提升、成本降低、效率优化买单。”
吴泳铭也提到,大量企业在用Token消耗时,并不把它当成IT预算,而是当作公司的生产或研发成本、生产资料的一部分。
李强告诉记者,腾讯未将重点全放在Token消耗上。“假定Token是油耗,如果只关注油耗而不关注造引擎的经济性,可能用户端成本会很高,客户最终也会舍弃。”他举例,Token不是有黏性的业务,如果利用低价获取客户,哪天不发“红包和鸡蛋”,客户很容易流失。
他认为,与其关注Token,不如关注能否做出跟OpenClaw同样好用且更安全的Agent,以及把精力放在引擎研发上,确保更好的引擎、更低的油耗,未来在Token获取上占据主导地位。腾讯为此已经在补课。
还有大量Token使用发生在“看不见”的地方。例如金融机构下载开源模型在本地做票据识别、风控——这些调用不会被公有云统计。车端智能座舱模型为保护隐私,对话在车内闭环完成。机器人内置的CV小模型毫秒级响应,不可能依赖云端。还有大量企业基于开源模型做后训练、构建专属Agent,全部隐藏在冰山之下。
面壁智能相关负责人告诉记者,很多行业对过程可追溯、结果可审计有硬性要求。目前主流的Agent产品仍以云端交付为主,但在强敏感数据、强合规及高频调用场景下,会同时撞上安全可控与综合成本两道墙,这也是越来越多客户开始认真看待端侧方案的原因。
一位从业者对记者估算,非公有云API的调用量至少是公有云的5到10倍。“最大的客户都不用公开API,他们都在自己的环境里用。”
市场才刚刚开始
最新一波涨价背后,既有Token调用量暴涨等需求因素,也有供应链成本上升的原因,尤其是核心硬件采购成本的显著上涨。
一位AI平台负责人告诉记者,GPU芯片是大模型推理最核心的成本,一张高端GPU动辄几十万,运行一个大模型需要几十甚至几百张GPU同时工作。电费也是实打实的开销,一个大型推理集群一年的电费就是天文数字。此外研发摊销、运维和安全都有成本。
但他认为Token还有很大下降空间:芯片算力在增长、模型效率在提升、基础设施的规模效应在累积。
不过,“便宜的Token”不等于“好用的AI”。当Token价格不再是门槛,竞争焦点会转向模型能力、响应速度、定制化程度和对特定行业的理解深度。
多位从业人士认为,按Token计费或许只是一个过渡阶段,未来理想的模式是按结果付费。就像打滴滴不需要关心汽油消耗了多少升。
企业客户更关心消耗的Token有没有带来业务改变。如果一家基金公司用AI改造多模态数据治理,一家保险公司实现车险自动定损,一家重工业企业把高级技师的培养周期从几年缩短到几个月——这些结果才是客户愿意买单的。
当然,按结果付费还面临模型迭代、场景探索和衡量标准统一的挑战。但方向清晰:行业预期未来Token将演进为按结果付费,中间状态以“订阅+按量+效果付费”的混合体系过渡。
智谱董事长刘德兵预计,未来简单对话与轻量任务的低阶Token将走向低价、免费的广告模式,高复杂度、高可靠性、具备生产力能力的高阶Token将具备持续定价权。
钉钉CTO朱鸿则提到,过去软件以订阅为主,未来一条工作流调用的接口会变成API调用模式,按需付费。未来钉钉的龙虾产品“悟空”也会考虑按需付费、按效果付费的商业模式。
百度千帆平台产品负责人张婷预测,五年后Token可能从普通用户视野里消失,但价值会以另一种形式存在。Token价格继续下降,计费方式可能从“按Token数”演变成“按任务结果”。同时,随着多模态发展,Token的定义也会扩展为图像、音频、视频Token,计量单位更复杂。
在刘伟光看来,Token消耗的背后,AI是否真正提升了GDP、创造了新岗位、提高了社会效率更重要。
从这个角度看,市场才刚刚开始。大部分制造业企业还没真正使用AI,金融、医疗、教育等行业的AI应用深度不够,AI原生企业还处在爆发前夜。而Token,只是AI当中最原子级的单位。
免责声明:本页所载内容来旨在分享更多信息,不代表九方智投观点,不构成投资建议。据此操作风险自担。投资有风险、入市需谨慎。
推荐阅读
相关股票
相关板块
相关资讯
扫码下载
九方智投app
扫码关注
九方智投公众号
头条热搜
涨幅排行榜
暂无评论
赶快抢个沙发吧