- 1
- 0
- 约4.02千字
- 约 9页
- 2026-03-12 发布于广东
- 举报
1858年的夏天,一根铜芯电缆横穿大西洋海底,把伦敦和纽约连在了一起。
这件事的意义从来不在于传输速度,而在于权力结构,谁铺设了海底电缆,谁就能在信息流动中抽水。大英帝国靠着这张全球电报网,把殖民地的情报、棉花的价格、战争的消息都攥在手里。
帝国的强大不仅是有舰队,还有那根电缆。
一百六十多年后,这个逻辑正在以一种意想不到的方式重演。
2026年,中国大模型正在悄悄吃掉全球开发者市场。OpenRouter最新数据显示,平台前十模型的Token消耗中,中国模型独占61%,前三名清一色来自中国。旧金山、柏林、新加坡的开发者每天发出的API请求,正穿越太平洋海底光缆抵达中国数据中心,算力在那里消耗,电力在那里流动,结果传回来。
电力从未离开中国电网,但它的价值通过Token完成了跨境交付。
AI模型大迁徙
2026年2月24日,OpenRouter发布了一份周度数据:平台前十模型的总Token消耗约8.7万亿,中国模型独占5.3万亿,占比61%。MiniMaxM2.5以2.45万亿Token空降榜首,KimiK2.5、智谱GLM-5紧随其后,前三名清一色来自中国。
2月26日最新数据
这不是偶然,一根导火索点燃了一切。
今年初,OpenClaw横空出世,一个让AI真正开始干活的开源工具,可以直接控制电脑、执行命令、并行完成复杂工作流,GitHub星标数周内突破21万。
金融从业者John第一时间安装OpenClaw,并接入了AnthropicAPI,开始自动监控股市信息,并及时汇报给出交易信号,几个小时后,他盯着账户余额愣了几秒:几十美元,没了。
这就是OpenClaw带来的新现实。过去跟AI聊天,一次对话几千个Token,费用忽略不计。OpenClaw接入之后,AI在后台同时跑十几个子任务,反复调用上下文、循环迭代,Token消耗不是线性的,是指数级的。账单像开着引擎盖的车在加速,油表往下掉,停不下来。
开发者社群里随即流传出一个“妙招”:用OAuth令牌把Anthropic或Google的订阅账户直接接进OpenClaw,把月费制的“无限”额度变成AIAgent的免费燃料,这也是很多开发者采取的方法。
官方的反制随即到来。
Anthropic在2月19日更新协议,明确禁止将Claude订阅凭证用于OpenClaw等第三方工具,要接入Claude功能,必须走API计费通道。Google更是大面积封禁了通过OpenClaw接入Antigravity和GeminiAIUltra的订阅账号。
“天下苦秦久矣”,John随即投入了国产大模型的怀抱。
在OpenRouter上,国产大模型MiniMaxM2.5在软件工程任务上的得分是80.2%,ClaudeOpus4.6是80.8%,差距几乎可以忽略。但价格天差地别,前者输入端每百万Token0.3美元,后者5美元,差了约17倍。
John切了过去,工作流依然运转,账单缩水了一个数量级,这种迁徙正在全球范围内同步发生。
OpenRouter的COOChrisClark说得很直接,中国开源模型之所以能拿下大量市场份额,是因为它们在美国开发者运行的代理工作流中占比异常之高。
电力出海
要理解Token出海的本质,必须先搞清楚一个Token的成本结构。
它看起来很轻,一个Token大约等于0.75个英文单词,你跟AI的一次普通对话,消耗的也不过几千个Token。但当这些Token以万亿为单位堆叠,背后的物理现实就变得沉甸甸。
拆开Token的成本,核心只有两项:算力和电力。
算力是GPU的折旧摊销,你买下一块英伟达H100,花大约三万美元,它的寿命换算到每一次推理,就是折旧成本。电力是数据中心持续运转的燃料,GPU满载时每块耗电约700瓦,加上冷却系统的开销,一个大型AI数据中心的电力账单可以轻松超过年均数亿美元。
现在,把这个物理过程在地图上画出来。
一个美国开发者在旧金山发出一条API请求。数据从加利福尼亚出发,经由太平洋海底光缆抵达中国某地的数据中心,GPU集群开始工作,电从中国的电网流向那些芯片,推理完成,结果回传。整个过程,也许只用了一两秒。
电力,从未离开中国的电网,但电力的价值,通过Token,完成了跨境交付。
这里有一个普通贸易无法企及的神奇之处:Token没有形体,不需要经过海关,不会被关税打到,甚至不在任何现行的贸易统计口径里。中国出口了大量算力与电力服务,但在官方的商品贸易数据上,它几乎是隐形的。
To
原创力文档

文档评论(0)