多智能体

Search documents
论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster
量子位· 2025-06-03 07:59
Core Viewpoint - The article introduces PosterAgent, a tool designed to convert academic papers into visually appealing posters, highlighting its efficiency and effectiveness compared to existing methods like GPT-4o [2][18]. Group 1: PosterAgent Overview - PosterAgent can transform a 22-page paper into an editable ".pptx" poster for only $0.0045, significantly reducing token usage by 87% compared to GPT-4o [2][36]. - The tool is built upon the Paper2Poster framework, which establishes the first academic poster evaluation standard, addressing gaps in long-context and multi-modal compression assessments [4][18]. Group 2: Evaluation Metrics - Paper2Poster includes 100 pairs of AI-related papers and their corresponding posters, covering various subfields like computer vision (19%), natural language processing (17%), and reinforcement learning (10%) [20]. - The evaluation metrics focus on four dimensions: visual quality, text coherence, overall assessment, and PaperQuiz, which simulates communication between authors and readers [22][23]. Group 3: PosterAgent Components - The PosterAgent framework consists of three key components: a parser for extracting key content, a planner for organizing text and visuals, and a painter-commenter for generating and refining the poster layout [28][29]. - The system employs a top-down design approach to ensure coherence and alignment of content [25]. Group 4: Performance Comparison - In comparative tests, PosterAgent achieved the highest graphic relevance and visual similarity to human-designed posters, scoring an average of 3.72 when evaluated by a visual language model (VLM) [31][32]. - While GPT-4o-image had the highest visual similarity, it recorded the lowest coherence, indicating that its outputs may appear attractive but lack textual clarity [30][31]. Group 5: Cost Efficiency - PosterAgent demonstrated significant cost efficiency, requiring only 101.1K and 47.6K tokens for different variants, translating to a cost of $0.55 (based on GPT-4o) or $0.0045 (based on Qwen) per poster [36].
ICML 2025 Spotlight | 谁导致了多智能体系统的失败?首个「自动化失败归因」研究出炉
机器之心· 2025-05-30 03:28
问题来了:到底是哪个 Agent 出了错?又是在对话流程的哪一环节?调试这样的多智能体系统如同大海捞针,需要翻阅大量复杂日志,极其耗时。 这并非虚构。在多智能体 LLM 系统中,失败常见但难以诊断。随着这类系统愈加普及,我们急需新方法快速定位错误。正因如此,ICML 2025 的一篇 Spotlight 论 文提出了「自动化失败归因(Automated Failure Attribution)」的新研究方向,目标是让 AI 自动回答:是谁、在哪一步导致了失败。 该工作由 Penn State、Duke、UW、Goolge DeepMind 等机构的多位研究人员合作完成。 论文标题:Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems 背景挑战 LLM 驱动的多智能体系统在诸多领域展现出巨大潜力,从自动化助手协同办公到多 Agent 合作完成 Web 复杂操作等。然而,这些系统 脆弱性 也逐渐显现:多个 Agent 之间的误解、信息传递错误或决策不当,都可能导致 ...
百度心响上线iOS版,多智能体协作应用终于卷对地方了
量子位· 2025-05-27 03:53
小明 发自 凹非寺 量子位 | 公众号 QbitAI 今年的4月26日, 我们测评了百度新发布的多智能体协作应用心响APP 。当时只上线了安卓版,很多网友在线求苹果版链接。 就在这几天, iOS版也终于上线了 ,只需要在苹果的APP Store搜索关键词即可下载。 现在,苹果安卓用户全部免费用,完全不限量! 在第一时间体验了iOS版心响APP,我们基本上可以下一个判断:智能体应用,终于卷对地方了。 不仅体验门槛低——苹果安卓用户,下载APP就能用, 无需邀请码、每天不限次数 。 而且玩法超全,各类火热的智能体玩法,这一个APP就够用了。 比如定制一个北京游玩攻略,向智能体提出具体的需求,它便能自己拆解任务、调用多个智能体生成对应的方案,甚至四天游玩的路线都基于 地图MCP清晰呈现了出来。 最近智能体真的太火了,各种APP都在接入,让普通人眼花缭乱。 但实际使用还是有很多gap,比如邀请码、用量限额、能力不全面等,导致实际体验受影响。 现在,一个APP,把上述问题都搞定了。 具体体验,来看量子位一手实测。 全能自主的AI搭子 我们具体实测了旅游攻略、深度研究、法律咨询、试题讲解几大场景。 最近很火热的 深度研究 ...
首届国际通用人工智能大会:东西方视角共探AGI未来
Huan Qiu Wang Zi Xun· 2025-05-26 09:52
来源:光明网 光明网讯5月24日至25日,由北京通用人工智能学会主办的首届国际通用人工智能大会在北京召开。作 为我国首个聚焦通用人工智能(AGI)的国际学术盛会,来自全球数十个国家和地区的近千位专家、学 者、技术领袖齐聚一堂,深度碰撞AGI原创性技术路线。 人工智能的终极目标是实现通用人工智能(AGI),通用人工智能就是要重造能够匹配人类各种能力与 智力、符合人类情感与伦理价值的通用智能体。然而,当前的AGI叙事被西方国家主导,中国能否在通 用人工智能领域建立自主的、原创的独立思想和流派,关系到能否在这场科技竞争中抢占制高点。 具身智能与机器人专题会议汇聚全球具身智能领域权威学者,分享多模态感知、运动控制、仿生机器人 等领域的最新研究,探索智能体如何通过物理交互实现真正的环境理解和自主决策等关键科学问题的突 破路径。 全球智慧激荡,打造AGI学术高地 本届大会展示了当前全球AGI领域的最前沿研究,涵盖4场专题报告、6个专题会议,邀请了来自哈佛大 学、加州大学圣地亚哥分校、新加坡管理大学、莫斯科国立罗蒙诺索夫大学、北京大学、清华大学等国 内外知名高校及研究机构的40余位嘉宾进行高密度学术演讲。 北京通用人工智能 ...
AI智能体(七):多智能体架构
3 6 Ke· 2025-05-20 23:13
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:2025年是AI智能体元年。本系列文章旨在介绍AI智能体的概念、类型、原理、架构、开发等,为进一步了解AI智能体提供入门知识。本文为系列 文章的第七篇,文章来自编译。 引言 智能体是通过大语言模型(LLM)控制应用流程的系统。随着系统复杂度增加,管理和扩展会愈发困难,常见问题包括: 智能体工具过多导致决策低效 单智能体难以处理复杂的上下文 系统需要多个专业领域的配合(如规划师、研究员、数学专家等) 随着智能框架的发展,企业开始构建多智能体系统,寻求通用解决方案。两年前研究者开发了ChatDev协作系统,这个虚拟软件公司通过CEO、产品总监、 设计师、程序员等多角色智能体协同工作,成功开发出电子游戏。 单智能体架构 问题表现包括: 在涉及到数据提取、报告生成等差异化任务时,多智能体分工优势显现。各智能体专注专业领域,提升解决方案质量,同时降低开发难度。 工具过载:选择困难症 上下文膨胀:超出处理能力 错误增加:泛化职责导致输出劣化 多智能体架构 这些智能体成功协作开发游戏后,人们认为多角色架构可解决所有 ...
飞猪“问一问”:国内在线旅游垂直领域首个多智能体驱动的724小时AI应用
Huachuang Securities· 2025-05-05 08:13
证 券 研 究 报 告 2)机票比价:利用飞猪实时数据库,抓取实时浮动价格因素形成高性价比机 票方案,并嵌入动态预算分配与风险提示,实现"比价-解析-决策"闭环,大 大提高用户出行决策效率。 3)酒店推荐:多维度房源对比,精准匹配需求酒店。在飞猪"问一问"酒店 推荐功能中,用户提出客房需求后,系统快速穿透房源信息,并结合近两月真 实评价(过滤差评率>10%的酒店),生成"性价比高"、"高分推荐"、"高端奢 华"等多个差异化方案,显著提高用户酒店筛选效率,提升推荐方案匹配精度。 4)目的地探索:多维度智能决策,个性化推荐探索旅行目的地。该模块基于 用户需求进行深度语义解析,能够结合时间适配性、预算约束、用户画像等核 心信息,调用实时酒店、航空等供应链数据与飞猪内部 UGC 内容,生成兼具 可行性与差异化的目的地推荐方案。 AI 产品测评体验系列报告 飞猪"问一问":国内在线旅游垂直领域首个 推荐(维持) 多智能体驱动的 7*24 小时 AI 应用 风险提示:政策监管趋严;AI 技术迭代发展不及预期;AI 产品商业化不及预 期;单次测试结论存误差等。 电话:010-63214660 邮箱:liuxin3@hcyj ...
中贝通信:大公智能揭牌成立 重点布局“数字分身+多智能体”技术研发
Zheng Quan Shi Bao Wang· 2025-04-28 09:09
中贝通信表示,对大公智能的投入,既是对人工智能前景的看好,更是企业转型升级的必然选择,对大 公智能的布局,将充分释放公司在算力基础设施、行业智能化转型、数据价值挖掘及平台化运营等维度 的协同效应。 近年来,中贝通信智算集群建设快速扩张,持续加码"人工智能+新能源"战略布局,随着武当智算集 群、三江源智算集群、中贝合肥智算集群、上海松江智算集群以及上海临港(600848)智算集群等多个 集群陆续建成并投放使用,公司基本完成智算集群全国业务布局,目前已运营算力规模超过15000P。 后面随着更多算力集群建设交付,将成为推动人工智能产业发展的重要底座。 从智算集群的规模化部署到AI新兴业务的战略性孵化,中贝通信将联合大公智能,依托"新基建+新技 术"的深度融合,共同构建智能时代的创新生态体系(胡敏) 4月27日,中贝通信(603220)战略孵化的武汉大公智能科技有限公司(简称"大公智能")揭牌成立。这 家以"开发'通用数字分身技术'"为愿景的AI企业,将重点布局"数字分身+多智能体"技术研发,AI赋能 多元行业应用注入新动能。 作为中贝通信在人工智能领域的重要布局,大公智能公司相关负责人介绍未来三年发展规划:首年聚 ...
百度李彦宏:帮助开发者全面拥抱MCP
Guang Zhou Ri Bao· 2025-04-27 19:06
过去一年,大模型世界风云变幻。大模型厂商之间的竞争,令开发者不敢放心大胆做应用。李彦宏对开 发者说,"只要找对场景,选对基础模型,有时候还要学一点调模型的方法,在此基础上做出来的应用 是不会过时的"。他强调,"没有应用,芯片、模型都没有价值。模型会有很多,但应用才是王者。" 超出市场预期的是,百度在Create开发者大会上连发两大模型:文心大模型4.5 Turbo和文心大模型X1 Turbo,具备多模态、强推理、低成本三大特性。具体而言,文心4.5 Turbo,相比文心4.5,价格下降 80%;文心X1 Turbo,相比文心X1,在性能提升的同时价格再降50%。 李彦宏认为,当前开发者做AI应用的一大阻碍,就是大模型成本高、用不起。成本降低后,开发者和 创业者们才可以放心大胆地做开发,企业才能够低成本地部署大模型,最终推动各行各业应用的爆发。 文心X1 Turbo是基于4.5 Turbo的深度思考模型,在性能提升的同时,具备更先进的思维链,问答、创 作、逻辑推理、工具调用和多模态能力进一步增强。"有了这样超级能干的基础模型,我们就可以打造 出超级有用、超级有趣的AI应用来。"李彦宏表示。 一年一度的Creat ...
基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作
机器之心· 2025-04-27 10:40
本文由上海人工智能实验室,悉尼大学,牛津大学联合完成。第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。通讯作者为上海人工智能实验 室青年科学家白磊和牛津大学访问学者,悉尼大学博士生尹榛菲,团队其他成员还有 ailab 实习生薛翔元。 ReSo 框架( Re ward-driven & S elf- o rganizing)为复杂推理任务中的多智能体系统(MAS)提供了全新解法,在处理复杂任务时,先分解生成任务图,再为每个 子任务匹配最佳 agent。将任务图生成与奖励驱动的两阶段智能体选择过程相结合,该方法不仅提升了多智能体协作的效率,还为增强多智能体的推理能力开辟了 新路径。 研究背景:LLM 推理能力的掣肘与突破口 近年来, 增加推理时间(Inference Time Scaling) 被广泛认为是提升大语言模型(Large Language Models, LLMs)推理能力的重要途径之一。一方面,通过在训 练后阶段引入强化学习与奖励模型,可优化单一模型的推理路径,使其在回答前生成中间步骤,表现出更强的逻辑链构建能力;另一方面,也有研究尝试构建 多 智能体 ...
百度发布通用超级智能体「心响」,要做真正“长在用户手机和心里”的超级有用App
IPO早知道· 2025-04-26 02:16
心响App现已覆盖知识解析、旅游规划、学习办公等场景中200个任务类型。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据 IPO早知道消息, 百度 在 4月25日举行的 Create2025百度AI开发者大会 正式发布 了 多智能体 协作 App 「 心响 」,其定位 一站式解决用户复杂问题的 "通用超级智能体" 。目前,心响已覆盖 知识解析、旅游规划、学习办公等场景中 200个任务类型。 百度创始人李彦宏在本次开场演讲中 强调, "未来真正统治这个世界的是应用,应用才是王者。" 更 进一步来讲, 多智能体协作是下一个高价值的 AI应用方向。未来的AI应用将从回答问题走向任务交 付,而任何一个复杂任务的交付,都需要多智能体的协作来解析需求、分拆任务、调度资源、规划执 行,最终交付结果。 鲜为人知的是, 这样一款能解决 从信息检索到任务完成 全部流程的 通用超级智能体 , 诞生 于百 度 一支仅有几十人的自发的内部创业团队, 且 这群人大部分都是 95后 。 短短 30天 内,这支小 团队 从零开始 打造出了这款产品 。 当然,鉴于这款产品前期打磨的时间较短,故现 ...