自动化失败归因 - filings, earnings calls, financial reports, news

自动化失败归因

Search documents

智能体自己出现问题自己找！首次提出“自动化失败归因”课题 | ICML2025 Spotlight

量子位· 2025-06-11 02:27

近年来，LLM Multi-Agent系统引起广泛关注。它们各显神通，协同作战解决复杂难题。然而，一顿操作猛如虎，最终结果却"惨不忍睹"，一整个任务失败。这时候，你是不是头都大了：究竟是哪个环节的哪个Agent出了岔子？允中发自凹非寺量子位 | 公众号 QbitAI 在日益复杂的Multi-Agent系统中，由于Agent之间自主协作、信息链条长，失败不仅常见，而且诊断起来极其困难。如果我们不能快速定位失败的根源，系统的迭代和优化就无从谈起。针对这个问题，宾夕法尼亚州立大学与杜克大学联合Google DeepMind等机构的研究者们首次提出了"自动化失败归因"这一全新研究课题，并为此构建了首个专用基准数据集Who&When，开发和评估了多种自动化归因方法。这项工作不仅深刻揭示了该任务的复杂性，也为未来提升LLM Multi-Agent 系统的可靠性开辟了新的道路。该论文获ICML 2025 Spotlight，代码与数据集已全部开源。首次提出"自动化失败归因"课题 LLM驱动的Multi-Agent系统在很多领域展现出巨大潜力。然而，这些系统也存在着脆弱性：单个Agent的失误，Ag ...

自动化失败归因

Artificial Intelligence

LLM Multi - Agent系统

自动化失败归因

Artificial Intelligence

LLM Multi - Agent系统

ICML 2025 Spotlight | 谁导致了多智能体系统的失败？首个「自动化失败归因」研究出炉

机器之心· 2025-05-30 03:28

问题来了：到底是哪个 Agent 出了错？又是在对话流程的哪一环节？调试这样的多智能体系统如同大海捞针，需要翻阅大量复杂日志，极其耗时。这并非虚构。在多智能体 LLM 系统中，失败常见但难以诊断。随着这类系统愈加普及，我们急需新方法快速定位错误。正因如此，ICML 2025 的一篇 Spotlight 论文提出了「自动化失败归因（Automated Failure Attribution）」的新研究方向，目标是让 AI 自动回答：是谁、在哪一步导致了失败。该工作由 Penn State、Duke、UW、Goolge DeepMind 等机构的多位研究人员合作完成。论文标题：Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems 背景挑战 LLM 驱动的多智能体系统在诸多领域展现出巨大潜力，从自动化助手协同办公到多 Agent 合作完成 Web 复杂操作等。然而，这些系统脆弱性也逐渐显现：多个 Agent 之间的误解、信息传递错误或决策不当，都可能导致 ...