“2.5万个假账号背后的真相:Token的虚假繁荣,谁在为GPU估值买单?”

2026 年 6 月,Dario Amodei(Anthropic CEO)给美国参议院和白宫递了一封信,措辞极重——「明目张胆」「非法」「迄今最大规模的蒸馏攻击」。

被告是阿里巴巴的通义千问团队。指控细节:

  • 近 25,000 个欺诈账号
  • 45 天,2880 万次 Claude 交互
  • 目标:榨取 Claude 在软件工程和 Agent 推理上的能力

这事儿表面是商业纠纷,实则撕开了一个行业秘密:那些看起来爆表的 Token 消耗量里,有多少是这种「工业级蒸馏」在 24 小时空转堆出来的?

如果剥离掉这部分,你会发现,上游 GPU/HBM 的「紧缺叙事」,可能建立在相当虚的基础上。

三层行为指纹:谁是真人,谁是蒸馏

要分辨 Token 的真实性,不用看公关稿,看调用曲线的「间隙密度」就够了。

真人用户是「脉冲式」的。问 → 读 → 想 → 再问。两轮请求之间有几秒到几十秒的人为 pause,session 长度几分钟到几十分钟,夜间还有作息低谷。曲线是锯齿状,昼夜波动率明显。

Agent 是「块状」的。虽然自动化,但每生成一个片段就要停下来——检索代码库、读本地文件、跑单元测试、等外部 API 返回。段与段之间有 I/O 阻塞,曲线是一块一块的,不是直线。

唯有蒸馏,是「零间隙直线」。Teacher 吐 CoT → Student 接收 → 下一个 batch 立刻塞进来。纯内存直通,没有思考、没有检索、没有吃饭睡觉。24 小时稳态满载,波动率趋近于零。

回到 Anthropic 告的那桩案子:2.5 万个账号、45 天、2880 万次——平均每个账号每天调用约 25-26 次。这绝不是真人节奏(真人不会让 2.5 万个账号同时「活」45 天还不眠不休),这是典型的脚本化稳态调度。换句话说,这批 Token 从出生到死亡,没有一个真实人类意图在驱动它。

这已经不是孤例,是行业底噪

Anthropic 自己 2 月还告过一轮:DeepSeek、月之暗面、Moonshot,三家共用约 2.4 万个账号、1600 万次 Claude 交互。

两波加起来:5 万账号、4500 万次调用——这只是 Anthropic 一家曝出来的,只是 2026 年上半年这小半年的。整个行业没曝出来的工业级蒸馏,体量只会更大。

这就是为什么「中国大模型日均 Token 140 万亿、两年千倍」的增长曲线,和你体感的「AI 有用时刻没涨千倍」之间,存在巨大断裂。增量里相当一部分是 Teacher-Student 内循环在空转。

三个参数识破「GDP 幻觉」

① 昼夜波动率 = (日间峰值 − 夜间谷值) / 日均 Token

比值越平,蒸馏/代理垫底越多。目前各家只敢报「日均平滑版」,一拆小时级,夜间那截平底就露馅——那截就是 2.5 万账号们在跑。

② 脉冲系数 = 单位时间 Token 消耗的变异系数 (CV)

真人调用 CV 高(忽高忽低),蒸馏调用 CV 趋零(24h 直线)。Anthropic 案里那 2.5 万账号如果单拉曲线,CV 大概率 < 0.05。

③ 信息增量系数 = 该批次 Token 带来的净新知 / Token 数

蒸馏是零和搬运,Teacher 知道的东西 Student 学着知道,净增量 ≈ 0。ICML 2026 有篇 The Necessity of Imperfection 点得很明白:合成数据追求统计平滑,会把人类文本里那些长尾的、不规则但有认知价值的东西系统性削掉,长期训下去就是 model collapse。

一个回旋镖:谁也别说自己干净

写到这里得补个反转——Dario 告别人蒸馏他的时候,有开发者发现 Claude Opus 4.8 被问「你是谁」会答「我是通义千问」「我是 DeepSeek」。

这意味着什么?Anthropic 自己的训练数据里,也混了 Qwen 和 DeepSeek 的输出。整个行业其实在双向互蒸:美方蒸中方开源,中方蒸美方 API,Token 在模型之间循环旅行,没人说得清某一颗 Token 的「源头真人意图」还剩多少。

Anthropic 去年还因为从盗版网站扒了 700 万本盗版书训练模型,赔了 15 亿美元和解。所以 Dario 这封「讨贼檄文」,技术层面是真的(2.5 万账号确实不像真人),道德层面嘛……就当行业互揭老底看吧。

回到 GPU 的估值逻辑

这才是这篇文章真正想说的。

蒸馏 Token 对上游硬件的消耗是一次性沉没成本——训完那个小模型,这批 Token 就死了,不会再产生续费。而真人 Token 有复购(明天有新需求再来),Agent Token 虽自动化但跟着任务走。

所以算力扩张的真正驱动力如果是「蒸馏」,那这个需求的天花板是假的——它可以无限自循环,但不创造净价值。真人 + Agent 的真实需求,受限于人类注意力带宽和任务总量,是有物理上限的;蒸馏的上限只受限于谁愿意烧电。

现在行业的叙事是:Token 暴涨 → 推理爆发 → 必须扩卡 → HBM 紧缺 → 英伟达业绩炸。这个链条成立的前提是 Token 对应真实可持续需求。一旦市场开始按「有效 Token」而非「总 Token」定价——也就是把昼夜波动率、脉冲系数、信息增量这三层筛子架上——有些估值可能要重算。

结语

Dario Amodei 那 2.5 万账号的指控,与其说是「抓贼」,不如说是一次无意间的数据披露:原来行业里有这么多 Token,是 25,000 个假身份在 45 天里不眠不休喂出来的。

蒸馏让 GPU 看起来永远不够用,但那是因为蒸馏 Job 不会睡觉,而人会。

等大家学会区分「有效 Token」和「内循环 Token」的那天,140 万亿可能会缩水成 28 万亿——而上游那堆卡的采购逻辑,也得跟着重来一遍。

延伸思考

这条线其实还能往下挖几个方向,列在这里供自己后续展开:

  • 训练侧能耗审计:能不能从 Hugging Face / 论文里扒到 Qwen 3、DeepSeek V4 这批「被蒸馏嫌疑」的模型的 H100 训练小时数,再反推蒸馏成本占比?
  • Token 真实增长率:如果拉不到 Token 真实数,能不能用「API 调用次数 / 日活开发者数」做替代指标,看调用量有没有跟着开发者规模线性涨?
  • 算力租赁市场的二级信号:CoreWeave、Lambda 这些 GPU 云厂的订单里,「预训练短租」和「推理长租」的比例变化,比直接看 Token 数更能反映蒸馏占比。
  • 监管层面的「Token 真实性披露」:欧盟 AI Act 修订草案里有没有可能在 2027 年要求厂商披露昼夜 Token 波动率?这条如果成立,会立刻成为蒸馏产业链的达摩克利斯之剑。

---

**本文由 AI 生成**。内容基于公开事件的个人观点整理,事实细节(2.5 万账号 / 2880 万次 / 45 天)以 Anthropic 致参议院信件为准,可能存在解读偏差。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注