让AI智能体「记住」失败经验:微软提出Re-TRAC框架,4B性能SOTA,30B超越358B
想象一下,你让 AI 助手结合搜索工具探索一个复杂问题。它第一次探索时走错了方向,但第二次、第三次,它依然重复同样的错误探索路径。虽然你可能 可以从最终得到的多次探索结果中挑选出一个勉强满意的答案,但是这既低效,也需要人工干预。这就是当前大多数深度搜索智能体面临的困境——它们无 法「记住」之前的探索经验,每次都是从头开始,导致大量冗余搜索和资源浪费。 现有的深度搜索智能体大多基于 ReAct 框架构建,采用线性推理方式:「思考→调用工具→观察→再思考 」 。这种设计在简单任务上表现良好,但在需 要多轮探索的深度搜索任务中,往往陷入局部最优、重复探索和低效搜索的困境。 来自东南大学、微软亚洲研究院等机构的研究团队提出了一种全新的解决方案—— Re-TRAC (REcursive TRAjectory Compression) ,这个框架让 AI 智能体能够「记住」每次探索的经验,在多个探索轨迹之间传递经验,实现渐进式的智能搜索。 让探索变成「渐进式学习」过程 为什么 ReAct 会失败? ReAct 框架的核心问题在于其 线性设计 。每个探索轨迹都是独立的,模型无法回顾先前尝试的状态。在长上下文场景下,早期制定 ...