算力通胀终结者!凭一招把大模型Token成本砍到1/2
创业邦·2026-01-28 12:58

如果在两年前问一家大模型公司最需要什么?答案是 "有没有卡"。但如果今天再问同样的问题,答 算力通胀 之下 都用不起了 "我们正在制造大量的垃圾算力。" 一位负责大模型训练集群的架构师曾这样抱怨。他的焦虑并不是没有风声。过去十年是算力野蛮增长 的十年,规模的快速扩张确实带来了阶段性的产业繁荣。但繁荣背后,是难以忽视的效率困局。 为了追赶 GPT-4 乃至 GPT-5 的能力,国内企业陷入了一场疯狂的参数竞赛。数以万计的 GPU 被 高度集成化塞进数据中心,它们日夜轰鸣,但产出的智能效益却并未如预期般线性增长。 这是一种典型的 "算力通胀"。行业习惯用芯片的理论峰值( Peak Performance )来衡量价值,但 在现实的复杂的训练任务中,这些昂贵的芯片往往"有力使不出"。 数据显示,在许多大规模训练集群中,算力 的有效利用率( MFU )仅能维持在 40% 左右,而在推 理场景下,大量的算力更是处于闲置状态,利用率甚至不足 20% 。 算法迭代与硬件僵化之间的错位也在加剧这种浪费,模型架构每六个月就发生一次巨变,从 案也许会变成"好不好用"。 天数智芯给出的架构路线图: 2025 年的天数天枢架构,超越 ...

算力通胀终结者!凭一招把大模型Token成本砍到1/2 - Reportify