阿里、腾讯、百度集体调价，Token第一股年内狂�%，算力涨价潮来了

记者丨雷晨

编辑丨倪雨晴金珊江佩霞朱益民

国内云计算进入“算力通胀”时代。

4�日，阿里云宣布񑌫�日起，DDoS高防（中国内地）弹�费用上�%（从每兆瓦�元涨�元），这是阿里云一个月内第三次调价。

这一轮全球涨价潮由海外率先引爆——亚马逊AWS年初率先上调AI算力价格，谷歌云随后跟进，最高涨幅�%。腾讯云、百度智能云也同步跟进。腾讯𱆮񀙙日宣布AI算力、容器、EMR全线上񗠣%；百度智能云AI算力与存储上񗠣%~30%。

涨价背后最根本的驱动力，是Token消耗的爆发式增长。国家数据局局长刘烈宏𶞓�日的国新办新闻发布会上披露：“到今𻂋月，我国日均Token的调用量已超�万亿，相�年初�亿增长�多倍，相�年底�万亿，三个月时间又增长�%多。”

对于“Token”，国家数据局已正式将其定名为“词元”。它正从AI技术的计量单位，加速转变为智能时代的产业“货币”，其消耗规模的激增直接推高了算力需求，进而带动云计算服务价格上涨。

Token热度也蔓延到资本市场，去年底登陆港交所的“Token第一股”迅策仅�天市值突�亿港元，年内涨幅�%。

港股云巨头们近日也迎来股价大反弹，4�日盘中，百度集团涨񘜹%，阿里巴巴涨񙸯%，腾讯控股涨񘜴%。

Token消耗激增

OpenClaw是这轮Token需求爆发的核心因素之一。据OpenRouter平台数据，2026𻂋�日�日当周，平台接近四分之一的Token消耗由OpenClaw贡献。另据国金证券计算机行业周报，截�𻂋񀙙日�日的周度数据，OpenRouter平台�%的Token消耗由OpenClaw贡献，OpenClaw单周Token消耗量已相当�年第四季度全平台周均Token消耗量�%。

Token消耗量的快速攀升，首先暴露了一个深层矛盾：消耗量增长，并不等同于智能水平同步提升。智能体与传统Chatbot的业务逻辑存在本质差异。传统Chatbot遵循用户提问到模型回答的单轮交互模式，Token消耗与对话轮次呈线性关系。而智能体具备感知、决策、执行的闭环能力，需要自主拆解复杂任务、调用外部工具、多轮迭代验证，直至任务完成。这种业务逻辑的差异，直接导致了Token消耗量的数量级放大。

这个问题在商业层面已经产生了真实冲突。2026𻂌月初，Anthropic停止了订阅用户通过OpenClaw等第三方工具接入ClaudeAPI的许可。Anthropic官方解释称，部分重度用户每月仅支�美元订阅费，却消耗了价�美元的算力资源，给公司带来巨大成本压力。一个OpenClaw代理运行一天，消耗的算力成本�美元�美元之间，受影响用户需切换至按用量付费的API模式。

商业模式与智能体算力消耗现实之间的核心矛盾已然爆发。智能体场景下的Token消耗不可预测，没有历史数据可以参考，任何固定月费都在对一个无法建模的变量做猜测。问题的根源不在于定价策略本身，而在于Token消耗的底层逻辑正在被智能体技术彻底改写。

今𻂋月下旬，火山引擎总裁谭待在接�世纪经济报道等媒体采访时也指出，目前探索中的Token有一大半都是无谓的探索。他举例说，很多用户反馈智能体产品Token消耗快，核心问题不是单Token贵，而是它完成任务时的大量无效尝试——为了找到最终解法，超过一半的Token都消耗在探索中。如果单Token成本低但模型能力不足，需要消�倍甚�倍的Token还无法完成任务，最终只会造成更大的浪费。

这标志着，智能体的普及正在以远超预期的速度消耗算力资源，而现有的计费体系和效率管理机制仍有完善空间。

近期，小米集团MiMo负责人罗福莉在社交平台发文指出，从宏观角度看，全球计算资源增长的脚步已跟不上Agent带来的Token需求增长。真正的出路不是提供更便宜的Token，而是让“更高效的Agent框架”×“更强大且更高效的模型”协同演进。

算力持续紧缺

当前，推理正在取代训练成为算力消耗的主战场。德勤�𻂉月发布的《2026科技、传媒和电信行业预测》报告中指出，2026年AI推理将占算力三分之二，主要在�亿美元新数据中心及企业服务器进行。

而推理算力需求占比近七成之后，竞争规则正在改写。单Token成本、部署密度、能效比取代单纯峰值算力，成为客户选型的关键考量因素。

与此同时，算力供给的结构性缺口正在放大。根据半导体研究机构SemiAnalysis发布的数据，H100一年期租赁合同价格��月的低񆜻.70美元/小时/GPU飙升�𻂋月񊄪.35美元/小时/GPU，涨幅�%。该指数基于�多家云服务商、算力买家与卖家的月度直接调查构建。尽管价格上涨，相关GPU租赁容量已全部售罄，2026年初寻找新GPU算力资源的难度被比喻为“预订最后一班航班的机票”，不仅价格高昂且几乎无余量可选。

紧张的并不只有GPU。据报道，2026𻂋月下旬，英特尔与AMD相继通知客户上调处理器价格。过去几个月，CPU作为AI服务器调度与推理核心被云厂商大量采购，两大巨�年服务器CPU产能目前已基本售罄。

与此同时，头部互联网公司正在大幅加码资本支出。财报数据显示，腾讯资本支出�年迅速增加�亿元，同比增�%，2025年进一步增�亿元；阿里巴巴资本支出��亿元增长�年�亿元，突破千亿。据媒体公开报道，字节跳�年资本支出计划�亿元，约一半投向AI芯片和数据中心。

算力紧张的另一个侧面，是中国AI芯片市场格局正在发生深刻变化。据IDC数据，2025年中国市场AI加速卡总出货量约�万张。英伟达出货�万张，市场份�%；AMD出货�万张，市场份񟘦%。中国本土厂商合计出货�万张，市场份额�%。

在中国厂商阵营中，华为处于领先地位。据IDC数据，2025年华为出货�.2万颗AI芯片，约占整体市�%，接近国内供应商总出货的一半。阿里巴巴旗下平头哥以�.5万颗居次，市场份额񏊃%。百度昆仑芯与寒武纪各�.6万颗，并列第三。

中信证券指出，Agent&多模态等应用爆发驱动Token调用量井喷，进而导致国内算力荒，国产大模型在推理端积极适配为国产算力厂商带来加速放量机遇，预�年国产算力芯片出货量至少实现翻倍以上增长，将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。

本土厂商的崛起，正在逐步改变中国AI芯片市场的供给格局，为缓解算力缺口提供了新的可能。

商业模式重构

Token经济的最后一块拼图是商业模式。当Token消耗量从万亿级迈向百万亿级，如何定价、如何收费，直接关系到产业的商业闭环能否跑通。

回顾行业发展，2024年下半年�年初，中国大模型市场深陷价格战，字节豆包报价低񑍾.0008元/千Tokens，智谱自己也曾将GLM-4-Plus大幅降价。

但这一格局�年正在发生根本性变化。智谱成为国产头部模型厂商中首个在推出新模型的同时，执行实质性提价的公司。2月发布GLM-5时，CodingPlan套餐价格上�%起，3月发布GLM-5-Turbo时再�%，相对GLM-4.7累计涨幅�%。

涨价并未抑制需求。据智谱公开披露，2026年一季度API调用定价提升�%，调用量反而增�%。智谱MaaSAPI平台ARR�亿元，在过�个月提�倍。截�𻂋月，平台注册用户已突�万，覆盖全�个国家和地区。智谱CEO张鹏表示，当模型足够强，API本身就是最好的商业模式，定价权是由技术实力以及长期趋势所带来的领先地位决定的。

当前，Token计费正成为行业标准。今𻂋月，刘烈宏在中国发展高层论坛年会上指出，一套以词元（Token）计费为基础的新型商业逻辑正在加速演进，围绕词元的调用、分发与结算，一套新的价值体系正在加速演进形成。

但Token定价面临的真正难题，不在于收费标准，而在于智能体场景下的Token消耗目前高度不可预测。与电力或钢铁等传统生产要素不同，Token具备独特的可编程性。英伟达创始人兼CEO黄仁勋�𻂋月的一篇署名文章中，将Token定义为现代AI的基本单位，并指出它同时具有两种属性：作为语言，它是计算过程的原子；作为货币，它是价值流通的媒介。

谭待在受访时指出，判断行业阶段可以用终局倒推——看所有Tokens未来能产生的收入规模，再对比当前全球行业的实际收入，可以看出所处位置。目前OpenAI、Anthropic等企业的收入已知，全球行业收入大概是这些企业收入的三倍。

整体来看，AI算力与Token经济仍处于极早期阶段，定价机制、效率管理、供给能力等方面，仍有巨大的完善和提升空间。

越声投研：

（声明：文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。）

SFC

出品�财经客户端 21世纪经济报道

微信统筹丨江佩霞编辑丨金珊

21君荐读

【纠错】【责任编辑:hsisgsg】

深度观察

新华全媒头条丨网络疯传美国军机南海坠毁视频，但真相是这样的