让AI智能体「记住」失败经验：微软提出Re-TRAC框架，4B性能SOTA，30B超越358B

想象一下，你让 AI 助手结合搜索工具探索一个复杂问题。它第一次探索时走错了方向，但第二次、第三次，它依然重复同样的错误探索路径。虽然你可能可以从最终得到的多次探索结果中挑选出一个勉强满意的答案，但是这既低效，也需要人工干预。这就是当前大多数深度搜索智能体面临的困境——它们无法「记住」之前的探索经验，每次都是从头开始，导致大量冗余搜索和资源浪费。现有的深度搜索智能体大多基于 ReAct 框架构建，采用线性推理方式：「思考→调用工具→观察→再思考」。这种设计在简单任务上表现良好，但在需要多轮探索的深度搜索任务中，往往陷入局部最优、重复探索和低效搜索的困境。来自东南大学、微软亚洲研究院等机构的研究团队提出了一种全新的解决方案—— Re-TRAC （REcursive TRAjectory Compression），这个框架让 AI 智能体能够「记住」每次探索的经验，在多个探索轨迹之间传递经验，实现渐进式的智能搜索。让探索变成「渐进式学习」过程为什么 ReAct 会失败？ ReAct 框架的核心问题在于其线性设计。每个探索轨迹都是独立的，模型无法回顾先前尝试的状态。在长上下文场景下，早期制定 ...