DeepSeek对算力影响解读
DeepSeek 对算力影响解读 摘要 • DeepSeek 通过模型并行、Deep EP 技术和 new pipe 技术,显著提升 机器推理吞吐量(至少 5 倍)并降低延时(30%-50%),其中 new pipe 技术比标准 NCCL 通讯库效率高 20%-40%,延时减少 15%-30%。 • DeepSeek 在全球节点资源调度方面表现出色,通过昼夜切换提高资源利 用率 40%,降低综合成本 35%。其 KD cache 缓存机制命中率高达 56.3%,有效减少计算需求,提高推理效率。 • DeepSeek 采用 256 个专家的多专家架构,计算性能效率比其他厂商每层 16 个专家集合四个的做法高 8 到 10 倍,在同等算力下,计算性能明显优 于普通模型。 • DPC 声称用不到 2000 张卡支撑 2,400 万日活用户,但实际回答率仅为 20%,表明算力负载不足以完整响应用户请求,且 B 端和 C 端混合统计影 响了实际负载评估,该数据需要进一步澄清。 • 行业内毛利率通常在 40%-80%之间,DPC 公布的 85%毛利率过于乐观, 未充分考虑 H800 租金等成本。行业标准毛利率应为 60% ...