超760万元奖金悬赏,谁能徒手重构 DeepSeek 与 Kimi 的性能底层?
责编 | 梦依丹 出品丨AI 科技大本营(ID:rgznai100) 极致的推理延迟、极高的吞吐量、极大的模型规模……在大模型工程化的战场 上,这曾是一个被公认为'不可能'的三角。 回望 2025 年,DeepSeek-V3 技术报告为大家揭示了超大规模模型推理的新一代范式。通过 MLA 架构将 KV Cache 压缩 93%,配合 MTP(多 Token 预测) 技术大幅提升访存效率,全球开发者见证了万亿参数模型在大规模并发下实现"高吞吐、低延迟"的工程突破。 然而,站在 2026 年的当下,依靠 FP8 精度和基础架构已难以满足爆发式的即时响应需求。在大规模真实并发的洪流前,每一毫秒的延迟缩减,都直接 挂钩着数以亿计的算力成本与集群效能。 正是在这种"性能即生命"的行业背景下, 2026 线上黑客松:AMD E2E Model Speedrun 全球挑战赛正式拉开帷幕! AMD 联手 GPU MODE,豪掷 110 万美元 发起这场全球竞速。 寻找那些 能徒手 拆解底层逻辑、 将 AMD 旗舰算力的每一滴潜能都榨取出来的顶级开发者。 预选赛——入围即拿 1 万美金 本次大赛采用"预选赛 + 端到端决赛大考 ...