Workflow
未知机构:微信元宝与Deepseek微信接入DeepSee-20250225
2025-02-25 02:00

微信元宝与 Deepseek • 微信接入 DeepSeek 模型后,相应推理算力需求: • 微信接入 DeepSeek 模型后,相应推理算力需求: 目前在灰度测试阶段已观察到显著增长趋势,当前预计在下半年全量开放后日均请求 量将达到 10 亿次,并发峰 值可能达到百万级别。 同时据测算,为支撑如此规模,需要 数 千张 GPU 卡(H20 和 H100 混搭)。 为优化资源利用率,将结合混元基础推理等策略,根据查询类型动态分配不同深度的 推理路径,以降低整体负 载。 比如在具体实现中,会先通过预处理判断查询类型,再决 定调用哪种类型的推理路径。 例如,对于简单查,可采用混元基础准理以降低计算成本 (相比 DeepSeek 满血版可节省 30%推理算力需 求):对于复杂查间,则调用深度推理 路径(DeepSeek 满血版)以确保结果质量。 这种动态分配机制旨在平衡性能与成本,同 时提升整体系统效率。 目前在灰度测试阶段已观察到显著增长趋势,当前预计在下半年全量开放后日均请求 量将达到 10 亿次,并发峰 值可能达到百万级别。 为优化资源利用率,将结合混元基础推理等策略,根 同时据测算,为支撑如此规模,需要 数 ...