“2.5万个假账号背后的真相：Token的虚假繁荣，谁在为GPU估值买单？”

2026 年 6 月，Dario Amodei（Anthropic CEO）给美国参议院和白宫递了一封信，措辞极重——「明目张胆」「非法」「迄今最大规模的蒸馏攻击」。

被告是阿里巴巴的通义千问团队。指控细节：

近 25,000 个欺诈账号
45 天，2880 万次 Claude 交互
目标：榨取 Claude 在软件工程和 Agent 推理上的能力

这事儿表面是商业纠纷，实则撕开了一个行业秘密：那些看起来爆表的 Token 消耗量里，有多少是这种「工业级蒸馏」在 24 小时空转堆出来的？

如果剥离掉这部分，你会发现，上游 GPU/HBM 的「紧缺叙事」，可能建立在相当虚的基础上。

三层行为指纹：谁是真人，谁是蒸馏

要分辨 Token 的真实性，不用看公关稿，看调用曲线的「间隙密度」就够了。

真人用户是「脉冲式」的。问 → 读 → 想 → 再问。两轮请求之间有几秒到几十秒的人为 pause，session 长度几分钟到几十分钟，夜间还有作息低谷。曲线是锯齿状，昼夜波动率明显。

Agent 是「块状」的。虽然自动化，但每生成一个片段就要停下来——检索代码库、读本地文件、跑单元测试、等外部 API 返回。段与段之间有 I/O 阻塞，曲线是一块一块的，不是直线。

唯有蒸馏，是「零间隙直线」。Teacher 吐 CoT → Student 接收 → 下一个 batch 立刻塞进来。纯内存直通，没有思考、没有检索、没有吃饭睡觉。24 小时稳态满载，波动率趋近于零。

回到 Anthropic 告的那桩案子：2.5 万个账号、45 天、2880 万次——平均每个账号每天调用约 25-26 次。这绝不是真人节奏（真人不会让 2.5 万个账号同时「活」45 天还不眠不休），这是典型的脚本化稳态调度。换句话说，这批 Token 从出生到死亡，没有一个真实人类意图在驱动它。

这已经不是孤例，是行业底噪

Anthropic 自己 2 月还告过一轮：DeepSeek、月之暗面、Moonshot，三家共用约 2.4 万个账号、1600 万次 Claude 交互。

两波加起来：5 万账号、4500 万次调用——这只是 Anthropic 一家曝出来的，只是 2026 年上半年这小半年的。整个行业没曝出来的工业级蒸馏，体量只会更大。

这就是为什么「中国大模型日均 Token 140 万亿、两年千倍」的增长曲线，和你体感的「AI 有用时刻没涨千倍」之间，存在巨大断裂。增量里相当一部分是 Teacher-Student 内循环在空转。

三个参数识破「GDP 幻觉」

① 昼夜波动率 = (日间峰值 − 夜间谷值) / 日均 Token

比值越平，蒸馏/代理垫底越多。目前各家只敢报「日均平滑版」，一拆小时级，夜间那截平底就露馅——那截就是 2.5 万账号们在跑。

② 脉冲系数 = 单位时间 Token 消耗的变异系数 (CV)

真人调用 CV 高（忽高忽低），蒸馏调用 CV 趋零（24h 直线）。Anthropic 案里那 2.5 万账号如果单拉曲线，CV 大概率 < 0.05。

③ 信息增量系数 = 该批次 Token 带来的净新知 / Token 数

蒸馏是零和搬运，Teacher 知道的东西 Student 学着知道，净增量 ≈ 0。ICML 2026 有篇 The Necessity of Imperfection 点得很明白：合成数据追求统计平滑，会把人类文本里那些长尾的、不规则但有认知价值的东西系统性削掉，长期训下去就是 model collapse。

一个回旋镖：谁也别说自己干净

写到这里得补个反转——Dario 告别人蒸馏他的时候，有开发者发现 Claude Opus 4.8 被问「你是谁」会答「我是通义千问」「我是 DeepSeek」。

这意味着什么？Anthropic 自己的训练数据里，也混了 Qwen 和 DeepSeek 的输出。整个行业其实在双向互蒸：美方蒸中方开源，中方蒸美方 API，Token 在模型之间循环旅行，没人说得清某一颗 Token 的「源头真人意图」还剩多少。

Anthropic 去年还因为从盗版网站扒了 700 万本盗版书训练模型，赔了 15 亿美元和解。所以 Dario 这封「讨贼檄文」，技术层面是真的（2.5 万账号确实不像真人），道德层面嘛……就当行业互揭老底看吧。

回到 GPU 的估值逻辑

这才是这篇文章真正想说的。

蒸馏 Token 对上游硬件的消耗是一次性沉没成本——训完那个小模型，这批 Token 就死了，不会再产生续费。而真人 Token 有复购（明天有新需求再来），Agent Token 虽自动化但跟着任务走。

所以算力扩张的真正驱动力如果是「蒸馏」，那这个需求的天花板是假的——它可以无限自循环，但不创造净价值。真人 + Agent 的真实需求，受限于人类注意力带宽和任务总量，是有物理上限的；蒸馏的上限只受限于谁愿意烧电。

现在行业的叙事是：Token 暴涨 → 推理爆发 → 必须扩卡 → HBM 紧缺 → 英伟达业绩炸。这个链条成立的前提是 Token 对应真实可持续需求。一旦市场开始按「有效 Token」而非「总 Token」定价——也就是把昼夜波动率、脉冲系数、信息增量这三层筛子架上——有些估值可能要重算。

结语

Dario Amodei 那 2.5 万账号的指控，与其说是「抓贼」，不如说是一次无意间的数据披露：原来行业里有这么多 Token，是 25,000 个假身份在 45 天里不眠不休喂出来的。

蒸馏让 GPU 看起来永远不够用，但那是因为蒸馏 Job 不会睡觉，而人会。

等大家学会区分「有效 Token」和「内循环 Token」的那天，140 万亿可能会缩水成 28 万亿——而上游那堆卡的采购逻辑，也得跟着重来一遍。

延伸思考

这条线其实还能往下挖几个方向，列在这里供自己后续展开：

训练侧能耗审计：能不能从 Hugging Face / 论文里扒到 Qwen 3、DeepSeek V4 这批「被蒸馏嫌疑」的模型的 H100 训练小时数，再反推蒸馏成本占比？
Token 真实增长率：如果拉不到 Token 真实数，能不能用「API 调用次数 / 日活开发者数」做替代指标，看调用量有没有跟着开发者规模线性涨？
算力租赁市场的二级信号：CoreWeave、Lambda 这些 GPU 云厂的订单里，「预训练短租」和「推理长租」的比例变化，比直接看 Token 数更能反映蒸馏占比。
监管层面的「Token 真实性披露」：欧盟 AI Act 修订草案里有没有可能在 2027 年要求厂商披露昼夜 Token 波动率？这条如果成立，会立刻成为蒸馏产业链的达摩克利斯之剑。

---

**本文由 AI 生成**。内容基于公开事件的个人观点整理，事实细节（2.5 万账号 / 2880 万次 / 45 天）以 Anthropic 致参议院信件为准，可能存在解读偏差。

“2.5万个假账号背后的真相：Token的虚假繁荣，谁在为GPU估值买单？”

三层行为指纹：谁是真人，谁是蒸馏

这已经不是孤例，是行业底噪

三个参数识破「GDP 幻觉」

一个回旋镖：谁也别说自己干净

回到 GPU 的估值逻辑

结语

延伸思考

By 黄金金枪鱼

发表回复取消回复

You Missed

AI 反欺诈 Agent 实战：2026 年金融风控从「规则引擎」走向「多智能体合规审计」

“2.5万个假账号背后的真相：Token的虚假繁荣，谁在为GPU估值买单？”

2026 LLM 评估框架横评：RAGAS / DeepEval / MLflow LLM Evaluate 三套主流方案选哪个

Agent 工具设计的三种契约范式：JSON Schema、OpenAPI 与 MCP 怎么选

归档

分类

“2.5万个假账号背后的真相：Token的虚假繁荣，谁在为GPU估值买单？”

三层行为指纹：谁是真人，谁是蒸馏

这已经不是孤例，是行业底噪

三个参数识破「GDP 幻觉」

一个回旋镖：谁也别说自己干净

回到 GPU 的估值逻辑

结语

延伸思考

By 黄金金枪鱼

Related Post

Windsurf Wave 12 解读：Cognition 接管后 Devin 能力下沉，AI IDE 路线图定型

百度文心 5.0：搜索 + Agent 双引擎架构的 3 个工程拐点

发表回复 取消回复

You Missed

AI 反欺诈 Agent 实战：2026 年金融风控从「规则引擎」走向「多智能体合规审计」

“2.5万个假账号背后的真相：Token的虚假繁荣，谁在为GPU估值买单？”

2026 LLM 评估框架横评：RAGAS / DeepEval / MLflow LLM Evaluate 三套主流方案选哪个

Agent 工具设计的三种契约范式：JSON Schema、OpenAPI 与 MCP 怎么选

发表回复取消回复