CTAR
Search documents
先解行为,再训Agent:CMU开源首份Agentic Search日志数据,把Agent拆开给你看
机器之心· 2026-02-09 01:18
在大模型驱动的 Agentic Search 日益常态化的背景下,真实环境中智能体 "如何发查询、如何改写、是否真正用上检索信息" 一直缺乏系统刻画与分析。 CMU 团队基于可重复检索平台 DeepResearchGym,从统一后端的半年真实流量中整理出 1400 万余条搜索请求、约 400 万个会话,在严格匿名化与清洗后,构建并 于 Hugging Face 开源了首个 Agentic Search 行为日志数据集。 在此基础上,工作提出 "会话意图(Declarative / Procedural / Reasoning)→轨迹动作(专化 / 泛化 / 探索 / 重复)→检索信息采纳率(CTAR)" 三层分析框架,利用 LLM 进行会话切分与标签推断,刻画出智能体搜索中普遍存在的下钻偏好、事实型任务中的重试循环,以及不同改写模式对历史检索信息依赖程度的显著差异。 总体而言,该研究既为观察与评估 Agentic Search 行为提供了首个大规模开源日志,也为后续在智能体训练与系统设计中显式建模 "会不会搜" 提供了可复现的数据 基础与可量化的行为信号。 论文标题: Agentic Search in th ...