ICLR 2026|人大&通义:别再只会堆上下文了!IterResearch用40K上下文轻松实现2048轮交互不退化
机器之心·2026-03-02 15:16

以 40K 上下文,让 Agent 搜索 2048 轮,性能还能一路涨?这几乎是不可想象的。 当前主流的 Search Agent 都面临同一个尴尬:Agent 需要反复搜索网页、比对线索、验证假设、回溯修正,交互轮次动辄数十上百轮。但以 ReAct 为代表的传统范 式,把每一轮的思考和工具返回结果不断追加到同一个上下文窗口中 —— 做得越多,上下文越臃肿,留给推理的空间越少,早期的噪声和错误路径还被永久「焊 死」在记忆里。 结果就是: Agent 搜得越深入,反而「想」得越糊涂。 能不能让 Agent 在探索过程中不断「清理工作台」,始终在一个干净的空间里思考? 来自 中国人民大学与阿里巴巴通义实验室的研究团队提出了 IterResearch,一种全新的迭代式深度研究范式。 通过马尔可夫式的工作空间重构,IterResearch 让 Agent 在仅 40K 上下文长度下完成了 2048 次工具交互且性能不衰减,在 BrowseComp 上从 3.5% 一路攀升至 42.5%。 目前,该论文已被 ICLR 2026 接收。 「堆上下文」为什么难以实现 Interaction Scaling? 在 Searc ...