Prompt进化
Search documents
Agent「记吃不记打」?华为诺亚&港中文发布SCOPE:Prompt自我进化,让HLE成功率翻倍
机器之心· 2025-12-26 04:35
机器之心发布 当 Agent 遇到工具调用错误时,错误日志里往往已经包含了解决方案 —— 正确的参数格式、有效的 API 用法、甚至是直接可用的替代方案。然而,静态 的 Prompt 无法让 Agent 从这些反馈中 "学到教训",导致它们陷入 "错误循环":承认失败,却重复同样的动作。 华为诺亚方舟实验室与香港中文大学联合发布的 SCOPE 框架,旨在解决这一问题。 SCOPE 的核心思想是:既然 Agent 会被反复调用,那么它的 Prompt 就可以在执行过程中不断进化。通过从执行轨迹中自动提炼指导规则,SCOPE 让 Agent 能够 "从错误中学习",并将经验固化到 Prompt 中,实现自我进化。 Agent 的两大失败模式 研究团队分析了 GAIA 和 DeepSearch 基准上的 Agent 执行日志,发现了两类典型的失败模式: 论文:《 SCOPE: Prompt Evolution for Enhancing Agent Effectiveness 》 论文地址:https://arxiv.org/abs/2512.15374 开源地址:https://github.com/Jarvis ...