CL-Bench的故事没有结束,生成式CL-Bench:GENIUS来了
机器之心·2026-03-02 09:03

本论文由北京大学硕士生安睿川担任第一作者,他由张文涛教授与鄂维南院士的共同指导。研究方向主要是统一生成理解模型、以数据为中心的 AI。拥有 NeurIPS、ICLR、ECCV 等 4 篇一作或共同一作论文发表,曾在微软亚洲研究院实习。项目通讯作者由北京大学张文涛教授担任。 在 AGI-Next 前沿峰会上,姚顺雨曾抛出一个犀利的观点:大模型迈向高价值应用的核心瓶颈,其实在于能否「 用好上下文(Context) 」。OpenAI 的 Jiayi Weng 也在近期的访谈中表达了类似的洞察:上下文决定了模型与人类认知的边界。当信息不对等被消除,普通人也能胜任顶尖工作—— 本质上,是 上下文的处理能力拉开了智力的差距。 正是在这种共识下,混元与复旦团队近日发布的 CL-Bench 显得尤为重要。作为姚顺雨加入腾讯后的首秀,CL-Bench 建立了一个标杆:它严苛地审视了 模型在长程交互中「学习新知识」的能力。 但故事到这里就结束了吗? CL-Bench 精彩地解决了「输入端」的理解难题(Contextual Learning),但在「输出端」的生成环节,我们发现了另一块更为棘手的拼图: 如果上下文不仅是用来「学」的 ...

CL-Bench的故事没有结束,生成式CL-Bench:GENIUS来了 - Reportify