MIT新论文:2026推理模型过时了,“套娃模型”当立
3 6 Ke·2026-01-04 10:09

推理模型这就过时了? 当中的扛把子GPT-5被一篇博士生论文打了个措手不及,上下文窗口被甩出两个数量级。 而且新方法面对长文本时的"上下文腐烂"现象也大幅减少,关键是成本还更便宜。 这就是MIT最新论文当中提出的"套娃模型"新范式,被预言将成为今年的主流。 有网友评价说,递归模型不仅是在节省Token,更是在改变交互方式。 "套娃模型"正式名称叫做递归模型,核心流程是将文本存入代码环境,让模型编写程序拆解并递归调用自身处理。 从它的各种指标来看,推理模型,看上去真的是不香了。 代码驱动的递归推理 递归语言模型(RLM)一改将长文本直接作为Prompt输入神经网络的传统做法,转而采用一种"环境化"的处理范式。 其核心逻辑在于将自然语言处理任务重构为交互式编程任务,引入一个外部的Python REPL(读取-求值-输出循环)环境,将超长文本作为一个静态字符 串变量存储在内存中。 在这种架构下,大模型不再一次性编码所有信息,而是作为一个拥有读写权限的Agent,通过生成和执行Python代码来对这个外部变量进行操作。 这种设计从根本上解耦了输入数据的长度与模型自身的上下文窗口大小,允许处理的文本长度仅受限于物理内存 ...