Workflow
经验记忆
icon
Search documents
经验记忆黑科技:LightSearcher让AI工具调用减39.6%、推理快48.6%
机器之心· 2025-12-17 05:28
这些问题导致现有模型要么答案不准、可靠性差,要么工具调用过多、效率低下,难以同时满足推理准确和高效执行的核心需求。 如今,以 DeepSeek-R1 为代表的深度思考大模型能够处理复杂的推理任务,而DeepSearch 作为深度思考大模型的核心搜索器,在推理过程中通过迭代调用外部搜 索工具,访问参数边界之外的最新、领域特定知识,从而提升推理的深度和事实可靠性。 然而, 现有的 RL 驱动的深度思考大模型系统常常面临准确率与效率的「 跷跷板」困境:频繁调用搜索工具提升准确性,却带来计算开销和效率低下 。具体而 言,高频调用外部搜索工具虽能补充实时信息、提升推理准确率,但使得推理延迟大幅升高,等待时间可达几十秒至几分钟。从 用户体验角度来看,若信息加载 时间超过 10 秒,50% 的移动用户会放弃访问 。 北邮百家 AI 团队提出 LightSearcher 框架 ,首创基于经验记忆的高效 RL 优化技术,通过引入文本化经验记忆和自适应奖励塑造机制,巧妙解决了这一痛点。 在保持与 SOTA 基线 ReSearch 相当准确率的同时,搜索工具调用和模型回复时间显著缩短, 搜索工具调用次数减少 39.6%,推理时间缩 ...