Workflow
TIMRUN
icon
Search documents
思维链可无限延伸了,MIT等打破大模型上下文天花板
量子位· 2025-08-20 01:13
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 大模型的记忆墙,被MIT撬开了一道口子。 MIT等机构最新提出了一种新架构, 让推理大模型的思考长度突破物理限制,理论上可以无限延伸 。 这个新架构名叫Thread Inference Model,简称 TIM。 TIM配上专用推理引擎TIMRUN,把推理过程变成类似树状的递归子任务结构,并动态修剪掉不再需要的子任务,就能 让模型在输出窗口有 限的情况下实现几乎无限制的长程推理。 传统解决方案要么是把任务切分给多个模型处理,要么是压缩历史信息,但这两种方法都会损失信息完整性。 TIM团队提出了一个巧妙的洞察: 推理过程并不是线性的,而是像编程时一样具有递归结构。 例如当我们写代码时,通常只关注光标附近的代码、已完成函数的输入输出,以及待办事项,而不会记住每个函数的所有实现细节。 这种"潜意识"的信息过滤机制,正是TIM系统的核心灵感来源。 把推理过程"解剖"成任务树 TIM最大的创新在于将推理轨迹建模为递归的子任务树,而不是传统的线性token序列。 每个任务单元包含四个关键组件: 思考过程 (thought) 工具使用 (tooluse) 子任务列表 ( ...