Workflow
LoopTool
icon
Search documents
登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」
机器之心· 2025-11-19 04:07
机器之心发布 机器之心编辑部 在过去两年,大语言模型 (LLM) + 外部工具的能力,已成为推动 AI 从 "会说" 走向 "会做" 的关键机制 —— 尤其在 API 调用、多轮任务规划、知识检索、代码执行 等场景中,大模型要想精准调用工具,不仅要求模型本身具备推理能力,还需要借助海量高质量、针对性强的函数调用训练数据。 然而, 现有 数 据生成与训练流程多数是 "静态" 的 —— 数据在训练前一次性生成,无法感知到模型能力的改变。模型在微调或强化学习过程中也无法为数据生成 提供正向反馈。这不仅可能导致模型对已掌握的简单任务重复学习、浪费算力,同时留下一些难点样本长期缺乏优化;此外,很多现有流程依赖昂贵的闭源 API 生 成与评估数据,开源替代往往带入大量噪声标签,降低训练效果。 为解决这一系列问题,上海交通大学与小红书团队提出了 LoopTool :一个自动的(autonomous)、模型感知(model-aware)、迭代式(iterative)的数据进化框 架,首次实现了工具调用任务的数据–模型闭环优化。团队仅依靠开源模型 Qwen3-32B 作为数据生成器与判别器,在无闭源 API 依赖的情况下,让一 ...