Workflow
大语言模型任务规划
icon
Search documents
SIGIR 2025 | 解决扩展和迁移难题,华为新加坡提出InstructRAG,提升高达19%
机器之心· 2025-05-23 06:49
大语言模型(LLM)已成为规划复杂任务的强大工具。虽然现有方法通常依赖于 "思考 - 行动 - 观察"(TAO)过程,但这些方法受限于 LLM 固有的知识局限性。 检索增强生成 (RAG) 则利用外部数据库,将 LLM 生成与检索到的信息相结合。而将 RAG 应用于实际任务规划仍然面临着两个方面的挑战: 1. 可扩展性:通过遍历现有指令并将其组合成新的序列来扩展指令图的范围的能力,帮助 LLM 完成没有预定义路径的任务。 2. 可迁移性:开发能够快速适应新任务的技术,使模型能够从有限的示例中有效地学习。 针对大模型任务规划中的可扩展性与可迁移性挑战,华为2012中央软件院新加坡团队王政博士主导提出了InstructRAG方案,通过多智能体协同的元强化学习架 构,实现了:1)基于强化学习的指令图拓扑扩展;2)元学习驱动的少样本任务迁移。在跨领域的复杂任务测试中(包括多跳推理、具身决策、在线购物和科学 问答),相较现有最优方法取得19.2%的性能提升,并在50%噪声干扰下仅表现出11.1%的性能衰减,展现出较强的复杂场景适用性。 论文标题:InstructRAG: Leveraging Retrieval-Aug ...