超760万元奖金悬赏，谁能徒手重构 DeepSeek 与 Kimi 的性能底层？

责编 | 梦依丹出品丨AI 科技大本营（ID：rgznai100）极致的推理延迟、极高的吞吐量、极大的模型规模……在大模型工程化的战场上，这曾是一个被公认为'不可能'的三角。回望 2025 年，DeepSeek-V3 技术报告为大家揭示了超大规模模型推理的新一代范式。通过 MLA 架构将 KV Cache 压缩 93%，配合 MTP（多 Token 预测）技术大幅提升访存效率，全球开发者见证了万亿参数模型在大规模并发下实现"高吞吐、低延迟"的工程突破。然而，站在 2026 年的当下，依靠 FP8 精度和基础架构已难以满足爆发式的即时响应需求。在大规模真实并发的洪流前，每一毫秒的延迟缩减，都直接挂钩着数以亿计的算力成本与集群效能。正是在这种"性能即生命"的行业背景下， 2026 线上黑客松：AMD E2E Model Speedrun 全球挑战赛正式拉开帷幕！ AMD 联手 GPU MODE，豪掷 110 万美元发起这场全球竞速。寻找那些能徒手拆解底层逻辑、将 AMD 旗舰算力的每一滴潜能都榨取出来的顶级开发者。预选赛——入围即拿 1 万美金本次大赛采用"预选赛 + 端到端决赛大考 ...