18个月,中国Token消化狂飙300倍!别乱烧钱了,清华系AI Infra帮你腰斩API成本
机器之心·2026-02-02 06:14

编辑|吴昕 这两天, Clawbot 病毒式裂变,仿佛是一年前 Manus 的魅影重现。 同样一夜之间站上风口,同样点燃了无数开发者对「泼天富贵」的想象,也顺手把 Token 烧成了新的「硬通货」。 最近一组数据,让人更有体感。 中国大模型数量已超过 1500 个,下游开发者已经开始「疯狂盖房子」。数据显示, 2024 年初,中国日均 Token 消耗量约为 1000 亿;到 2025 年 6 月,这一数字已突破 30 万亿。 一年半时间,增长超过 300 倍 。 与三年前的 Chatbot 不同,「能干活」的 Agent 正以前所未有的强度,第一次把 API 调用推入「生产级」—— 一次看似简单的操作,背后往往是十几次、甚至几十次模型调用在同时发生。任何一次服务「抽风」,都会在 Agent 链路中引发一场多米诺骨牌式崩溃。 问题在于,中国大模型 API 服务现状,远比 benchmark 复杂得多。 更像是开盲盒,有人调侃说,以为自己在用「 DeepSeek V3.2 」,实际可能是蒸馏 / 量化版本。有人花了两周时间反复测试,上线后仍遭遇性能回退。 还有团队发现,模型会在某些凌晨时段准时「抽风」,延迟从 ...