CL-Bench的故事没有结束，生成式CL-Bench：GENIUS来了

本论文由北京大学硕士生安睿川担任第一作者，他由张文涛教授与鄂维南院士的共同指导。研究方向主要是统一生成理解模型、以数据为中心的 AI。拥有 NeurIPS、ICLR、ECCV 等 4 篇一作或共同一作论文发表，曾在微软亚洲研究院实习。项目通讯作者由北京大学张文涛教授担任。在 AGI-Next 前沿峰会上，姚顺雨曾抛出一个犀利的观点：大模型迈向高价值应用的核心瓶颈，其实在于能否「用好上下文（Context）」。OpenAI 的 Jiayi Weng 也在近期的访谈中表达了类似的洞察：上下文决定了模型与人类认知的边界。当信息不对等被消除，普通人也能胜任顶尖工作—— 本质上，是上下文的处理能力拉开了智力的差距。正是在这种共识下，混元与复旦团队近日发布的 CL-Bench 显得尤为重要。作为姚顺雨加入腾讯后的首秀，CL-Bench 建立了一个标杆：它严苛地审视了模型在长程交互中「学习新知识」的能力。但故事到这里就结束了吗？ CL-Bench 精彩地解决了「输入端」的理解难题（Contextual Learning），但在「输出端」的生成环节，我们发现了另一块更为棘手的拼图：如果上下文不仅是用来「学」的 ...