Workflow
大厂怎么看DeepSeek-V3
Seek .Seek .(US:SKLTY)2025-08-25 09:13

U18M 零 IP8 格式如何在节省算力和内存的情况下提升效率? U18M 零 IP8 格式通过将权重数据从 128 乘 128 量化块拆分成 128 乘 4 的小 块,从而减少显存占用和计算开销,同时保持计算精度。传统的 IP8 权重需要 大量显存在 128 乘 128 块中反复使用,而新的 U18M 零 IP8 则通过更小的数 据块减少了这些需求。此外,新方法还优化了反向量化过程,进一步节省存储、 显存和计算资源。这些改进使得新格式能够在保持高精度的同时,大幅提高训 练和推理效率。 大厂怎么看 DeepSeek-V3.120250824 摘要 Deepseek 定义 U18M 零 IP8 格式,旨在为国产芯片制定新标准,降低 训练侧显存占用 20%-30%,提升训练效率 30%-40%,并指导下一代 国产芯片设计,有望通过 OCP 扩展为国产芯片的 RP8 协议标准。 U18M 零 IP8 通过拆分量化块减少显存占用和计算开销,优化反向量化 过程,在保持高精度的前提下提高训练和推理效率,并采用混合精度策 略平衡性能与精度,敏感参数保留高精度计算(如 FP16)。 SP8 数据格式将提升国产大模型训练效率, ...