多智能体系统 - filings, earnings calls, financial reports, news

多智能体系统

Search documents

ICML 2025 Spotlight | 谁导致了多智能体系统的失败？首个「自动化失败归因」研究出炉

机器之心· 2025-05-30 03:28

问题来了：到底是哪个 Agent 出了错？又是在对话流程的哪一环节？调试这样的多智能体系统如同大海捞针，需要翻阅大量复杂日志，极其耗时。这并非虚构。在多智能体 LLM 系统中，失败常见但难以诊断。随着这类系统愈加普及，我们急需新方法快速定位错误。正因如此，ICML 2025 的一篇 Spotlight 论文提出了「自动化失败归因（Automated Failure Attribution）」的新研究方向，目标是让 AI 自动回答：是谁、在哪一步导致了失败。该工作由 Penn State、Duke、UW、Goolge DeepMind 等机构的多位研究人员合作完成。论文标题：Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems 背景挑战 LLM 驱动的多智能体系统在诸多领域展现出巨大潜力，从自动化助手协同办公到多 Agent 合作完成 Web 复杂操作等。然而，这些系统脆弱性也逐渐显现：多个 Agent 之间的误解、信息传递错误或决策不当，都可能导致 ...

3 6 Ke· 2025-05-20 23:13

神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点介绍国外的新技术、新观点、新风向。编者按：2025年是AI智能体元年。本系列文章旨在介绍AI智能体的概念、类型、原理、架构、开发等，为进一步了解AI智能体提供入门知识。本文为系列文章的第七篇，文章来自编译。引言智能体是通过大语言模型（LLM）控制应用流程的系统。随着系统复杂度增加，管理和扩展会愈发困难，常见问题包括：智能体工具过多导致决策低效单智能体难以处理复杂的上下文系统需要多个专业领域的配合（如规划师、研究员、数学专家等）随着智能框架的发展，企业开始构建多智能体系统，寻求通用解决方案。两年前研究者开发了ChatDev协作系统，这个虚拟软件公司通过CEO、产品总监、设计师、程序员等多角色智能体协同工作，成功开发出电子游戏。单智能体架构问题表现包括：在涉及到数据提取、报告生成等差异化任务时，多智能体分工优势显现。各智能体专注专业领域，提升解决方案质量，同时降低开发难度。工具过载：选择困难症上下文膨胀：超出处理能力错误增加：泛化职责导致输出劣化多智能体架构这些智能体成功协作开发游戏后，人们认为多角色架构可解决所有 ...

Artificial Intelligence

Artificial Intelligence

AI智能体

基于奖励驱动和自组织演化机制，全新框架ReSo重塑复杂推理任务中的智能协作

机器之心· 2025-04-27 10:40

本文由上海人工智能实验室，悉尼大学，牛津大学联合完成。第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。通讯作者为上海人工智能实验室青年科学家白磊和牛津大学访问学者，悉尼大学博士生尹榛菲，团队其他成员还有 ailab 实习生薛翔元。 ReSo 框架（ Re ward-driven & S elf- o rganizing）为复杂推理任务中的多智能体系统（MAS）提供了全新解法，在处理复杂任务时，先分解生成任务图，再为每个子任务匹配最佳 agent。将任务图生成与奖励驱动的两阶段智能体选择过程相结合，该方法不仅提升了多智能体协作的效率，还为增强多智能体的推理能力开辟了新路径。研究背景：LLM 推理能力的掣肘与突破口近年来，增加推理时间（Inference Time Scaling）被广泛认为是提升大语言模型（Large Language Models, LLMs）推理能力的重要途径之一。一方面，通过在训练后阶段引入强化学习与奖励模型，可优化单一模型的推理路径，使其在回答前生成中间步骤，表现出更强的逻辑链构建能力；另一方面，也有研究尝试构建多智能体 ...

投中网· 2025-03-12 04:49

锌财经 . 以下文章来源于锌财经，作者路世明关注新商业，关注新经济。一家由人民网投资的数字化媒体机构。将投中网设为"星标⭐"，第一时间收获最新推送 AI Agent的竞争既充满想象力，又暗藏风险。作者丨路世明编辑丨大风来源丨锌财经 Manus的出现，激起了科技与资本市场的双重震荡，一时间AI Agent相关概念股集体大涨，阿里、谷歌、微软等科技巨头密集发布智能体研发计划...... 而在这场热潮的背后，是AI技术从"被动应答"向"主动执行"的范式跃迁。尽管市场的评价褒贬不一，但不能否认，Manus的突破性在于，它首次验证了通用型AI Agent在复杂场景下的商业化可行性。传统的大语言模型虽能生成文本，却难以闭环执行任务，而Manus通过"规划-验证-执行"的架构，将 AI大模型的认知能力转化为生产力工具。根据麦肯锡等多份权威报告，在多元化需求驱动下，AI Agent市场呈爆发式增长态势，2024年全球 AI Agent市场规模约为51亿美元，预计2030年将飙升至471亿美元，复合年增长率高达44.8%。然而，这场"智能体浪潮"并非坦途。技术瓶颈与商业野心的碰撞，让AI Agent的 ...

Artificial Intelligence

AI Agent

多智能体系统（MAS）

Artificial Intelligence

Manus

AI Agent

Artificial Intelligence

AI Agent

多智能体系统（MAS）

Artificial Intelligence

Manus

AI Agent

Previous Next