多智能体

Search documents
下一代大模型高效计算:参数压缩、硬件适配与多模态推理、CoT等方向论文指导班来啦!
自动驾驶之心· 2025-07-04 07:13
⼀、课题简介⭐ 随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成 为当前人工智能研究的核心议题。本课程系统性地探讨大模型的前沿优化方法,重点研究参数高效计算、知识动 态扩展和复杂推理三大方向的关键技术。 课程将深入分析大模型优化中的核心挑战:在参数压缩方面,研究剪枝稀疏化和量化加速等轻量化方法;在知识 扩展方面,探索检索增强生成(RAG)和参数高效微调(PEFT)等动态知识注入技术;在推理优化方面,研究 链式思维(CoT)和强化学习优化(GRPO)等高级推理范式。同时,课程还将探讨多智能体协作和多模态理解 等前沿方向。 通过本课程的学习,你将掌握大模型优化的核心算法,包括但不限于:结构化剪枝、低比特量化、动态检索、角 色化智能体、多跳推理等关键技术。课程采用理论讲解与实验实践相结合的方式,使用主流大模型(如 LLaMA、GPT等)作为实验平台,重点培养学生在模型优化和推理增强方面的研究能力。 关键词:大模型优化;参数高效计算;检索增强生成;链式推理;多智能体协作;多模态理解 ⼆、课程目的 三、招生人数⭐ 6⼈/期(⾄多8人) 四、招生对象⭐ 五、课程收获 解决 ...
Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化
机器之心· 2025-07-03 03:26
本文第一作者为上海交通大学计算机科学四年级博士生万梓煜,主要研究方向为强化学习、基础模型的复杂推理,通讯作者为上海交通大学人工智能学院温颖副 教授和上海人工智能实验室胡舒悦老师。团队其他成员包括来自英属哥伦比亚大学的共同第一作者李云想、Mark Schmidt 教授,伦敦大学学院的宋研、杨林易和 汪军教授,上海交通大学的温潇雨,王翰竟和张伟楠教授。 引言 最近,关于大模型推理的测试时间扩展(Test time scaling law )的探索不断涌现出新的范式,包括① 结构化搜索结(如 MCTS),② 过程奖励模型(Process Reward Model )+ PPO,③ 可验证奖励 (Verifiable Reward)+ GRPO(DeepSeekR1)。然而,大模型何时产生 "顿悟(AhaMoment)" 的机理仍未明晰。近期多 项研究提出推理模式(reasoning pattern)对于推理能力的重要作用。类似的,本研究认为 大模型复杂推理的能力强弱本质在于元思维能力的强弱。 所谓 "元思维" (meta-thinking),即监控、评估和控制自身的推理过程,以实现更具适应性和有效性的问题解决,是智 ...
智能体不断进化,协作风险升高:五大安全问题扫描
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-03 00:36
Core Insights - The year 2025 is anticipated to be the "Year of Intelligent Agents," marking a paradigm shift in AI development from conversational generation to automated execution, positioning intelligent agents as key commercial anchors and the next generation of human-computer interaction [1] Group 1: Development and Risks of Intelligent Agents - As intelligent agents approach practical application, the associated risks become more tangible, with concerns about overreach, boundary violations, and potential loss of control [2] - A consensus exists within the industry that the controllability and trustworthiness of intelligent agents are critical metrics, with safety and compliance issues widely recognized as significant [2] - Risks associated with intelligent agents are categorized into internal and external security threats, with internal risks stemming from vulnerabilities in core components and external risks arising from interactions with external protocols and environments [2] Group 2: AI Hallucinations and Decision Errors - Over 70% of respondents in a safety awareness survey expressed concerns about AI hallucinations and erroneous decision-making, highlighting the prevalence of factual inaccuracies in AI-generated content [2] - In high-risk sectors like healthcare and finance, AI hallucinations could lead to severe consequences, exemplified by a hypothetical 3% misdiagnosis rate in a medical diagnostic agent potentially resulting in hundreds of thousands of misdiagnoses among millions of users [2] Group 3: Practical Applications and Challenges - Many enterprises have found that intelligent agents currently struggle to reliably address hallucination issues, leading some to abandon AI solutions due to inconsistent performance [3] - A notable case involved Air Canada's AI customer service, which provided incorrect refund information, resulting in the company being held legally accountable for the AI's erroneous decision [3] Group 4: Technical Frameworks and Regulations - Intelligent agents utilize various technical bridges to connect with the external world, employing two primary technical routes: an "intent framework" based on API cooperation and a "visual route" that bypasses interface authorization barriers [4] - Recent evaluations have highlighted chaotic usage of accessibility permissions by mobile intelligent agents, raising significant security concerns [5] Group 5: Regulatory Developments - A series of standards and initiatives have emerged in 2024 aimed at enhancing the management of accessibility permissions for intelligent agents, emphasizing user consent and risk disclosure [6] - The standards, while not mandatory, reflect a growing recognition of the need for safety in the deployment of intelligent agents [6] Group 6: Security Risks and Injection Attacks - Prompt injection attacks represent a core security risk for all intelligent agents, where attackers manipulate input prompts to induce the AI to produce desired outputs [7][8] - The emergence of indirect prompt injection risks, particularly with the rise of MCP (Multi-Channel Protocol) tools, poses new challenges as attackers can embed malicious instructions in external data sources [8][9] Group 7: MCP Services and Security Challenges - The MCP service Fetch has been identified as a significant entry point for indirect prompt injection attacks, raising concerns about the security of external content accessed by intelligent agents [10] - The lack of standardized security certifications for MCP services complicates the assessment of their safety, with many platforms lacking rigorous review processes [11] Group 8: Future of Intelligent Agent Collaboration - The development of multi-agent collaboration mechanisms is seen as crucial for the practical deployment of AI, with various companies exploring the potential for intelligent agents to work together on tasks [12][13] - The establishment of the IIFAA Agent Security Link aims to provide a secure framework for collaboration among intelligent agents, addressing issues of permissions, data, and privacy [14]
从代码生成到信贷风控 AI加速重构金融价值链
Xin Hua Cai Jing· 2025-07-02 12:19
信贷尽调从数月压缩至2小时、风险预警时效提升80%……这些曾被视为"未来场景"的变革,正在2025 年的金融业加速落地。随着DeepSeek等国产大模型爆发式迭代,AI Agent已不再是实验室概念,成为驱 动效率与创新的核心引擎。 业内人士认为,多智能体架构成为大模型落地的主要形式,能适配金融复杂业务场景的动态需求,已在 信贷业务的效率提升、风险研判及交互智能化方面展现出较大潜力。在AI重构金融价值链的进程中, 懂业务的技术者与懂技术的业务者,才能赢得"人机共舞"的主导权。 AI赋能流程改造势不可挡 随着大型语言模型(LLM)能力的指数级跃升与多智能体协作技术的突破性进展,2025年正被全球金 融科技界公认为"AI Agent元年"。这股浪潮正以前所未有的深度和广度冲击着金融行业的每一个角落, 推动着从后台运营到前台决策的全链条智能化革命。 "尽管这一概念已被提及多年,但今年我们真正在行业实践中感受到了它的落地,无论是身边的合作案 例、自身团队的探索,还是竞争对手的动态,都印证了Agent技术已从概念走向实操。"OpenCSG联合创 始人、CTO王伟说。 "AIGC推动金融行业软件研发工艺升级是必然趋势,这 ...
对话京东金融:如何让AI理财变得更加靠谱
Tai Mei Ti A P P· 2025-07-02 07:02
在金融科技迅猛发展的浪潮中,智能理财作为其中的重要创新领域,正深刻改变着财富管理行业的格局。智能理财本质上是一种在线理财服务,它运用大数 据、云计算、人工智能等现代信息技术,依据投资者的风险偏好、财产状况以及预期收益目标等个性化需求,借助资产配置模型匹配出最优的智能理财组 合,并提供自动化的资产配置建议。 与传统理财依赖理财师和投资顾问不同,智能理财的核心技术优势显著。大数据和人工智能是其最关键的技术支撑,用户行为大数据与金融交易大数据为机 器学习提供了丰富的"养料",进而驯化出人工智能这一智能理财的核心。通过对海量数据的分析,智能理财能够深入了解投资者的需求和市场动态。 智能理财还具有门槛低、费率低的特点。传统理财服务往往只面向中高净值人群,且每年收取的咨询费率较高。而智能理财大大降低了投资门槛和服务费 率,使得广大普通投资者,即长尾市场的客户,也能够享受到专业的理财服务。以美国的智能理财平台Betterment和Wealthfront为例,它们通过互联网信息 技术手段,让小额投资者也能获得个性化的财富管理服务。 渗透率不足美国1/5,中国智能理财靠什么跑出38%年增速? 2024年全球智能理财市场规模大约 ...
清华大学最新综述!具身AI中多传感器融合感知:背景、方法、挑战
具身智能之心· 2025-06-27 08:36
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Shulan Ruan等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 出发点与动机 1)具身AI与多传感器融合感知的重要性 近年来,随着深度学习和大型语言模型(LLM)的快速发展,人工智能在各个领域取得了显著进展。具身 AI作为AI的重要方向,指的是以物理实体为载体,通过在动态环境中实时感知来实现自主决策和行动能力 的智能形式,在自动驾驶、机器人群体智能等领域有广泛应用场景,是突破AI发展瓶颈、实现通用人工智 能(AGI)的关键路径。 在具身AI系统构建中,传感器数据理解是连接物理世界与数字智能的核心环节。具身智能体需要融合视觉 相机、毫米波雷达、激光雷达(LiDAR)、红外相机和惯性测量单元(IMU)等多模态传感器数据,以实 现对环境的全景感知。多传感器融合感知(MSFP)对实现具身AI的稳健感知和准确决策能力至关重要,例 如视觉相机易受光照变化干扰,而激光雷达在雨雾天气性能会大 ...
机器人顶会RSS 2025奖项公布!大牛Pieter Abbeel领衔研究获杰出Demo奖
机器之心· 2025-06-25 06:50
机器之心报道 机器之心编辑部 恭喜获奖者。 RSS(Robotics: Science and Systems,机器人科学与系统会议)是机器人领域顶级学术会议,自 2005 年起每年举办一次,该会议旨在促进机器人领域的科学研究和 技术应用的发展。 地址:https://roboticsconference.org/program/awards/ 杰出 Demo 论文奖 论文标题:Demonstrating MuJoCo Playground 论文摘要: 该研究提出了 MuJoCo Playground—— 这是一个基于 MJX 构建的完全开源机器人学习框架,其核心设计目标是大幅简化仿真环境搭建、模型训练以及 仿真到现实场景的迁移全流程。研究人员仅需执行简单的「pip install playground」安装命令,即可在单 GPU 硬件上完成分钟级策略训练。 该框架支持四足机器人、人形机器人、灵巧手及机械臂等多类型机器人平台,能够直接基于状态观测或像素级输入实现零样本仿真到现实迁移。 今年大会已于 6 月 21 日至 25 日在美国洛杉矶举行。杰出 Demo 论文奖、杰出系统论文奖、杰出学生论文奖、杰出论文奖 ...
科创100ETF基金(588220)涨超2%,百度推出多智能体协同AI
Xin Lang Cai Jing· 2025-06-24 07:07
截至2025年6月24日 14:23,科创100ETF基金(588220)上涨2.04%,成分股莱斯信息(688631)上涨 13.98%,神州细胞(688520)上涨9.80%,容百科技(688005)上涨8.69%,厦钨新能(688778),中信博 (688408)等个股跟涨。 科创100ETF基金(588220)紧密跟踪上证科创板100指数,上证科创板100指数从上海证券交易所科创板中 选取市值中等且流动性较好的100只证券作为样本。上证科创板100指数与上证科创板50成份指数共同构 成上证科创板规模指数系列,反映科创板市场不同市值规模上市公司证券的整体表现。 数据显示,截至2025年5月30日,上证科创板100指数(000698)前十大权重股分别为恒玄科技(688608)、 百济神州(688235)、睿创微纳(688002)、泽璟制药(688266)、纳芯微(688052)、国盾量子(688027)、翱捷 科技(688220)、华虹公司(688347)、安集科技(688019)、博瑞医药(688166),前十大权重股合计占比 24.16%。 科创100ETF基金(588220),场外联接A:01986 ...
ACL 2025 | 让小说角色 「活」起来!复旦BookWorld打造沉浸式小说世界模拟系统
机器之心· 2025-06-24 06:46
BookWorld由复旦大学冉一婷、王鑫涛主导完成,由阳德青老师、肖仰华老师共同指导。复旦大学知识工场实验室长期关注大语言模型的人格化、角色扮演 研究,在该领域发表多篇顶会论文和首篇综述。 想象为《红楼梦》或《权力的游戏》创造一个AI的世界。书中的角色们变成AI,活在BookWorld当中。每天,他/她们醒来,思考,彼此对话、互动,建立 感情和关系。 如果他们能活出自己的生活,不再由笔者操控,故事是否会不一样?会不会有一个平行时空里,宝玉和黛玉有了一段美好的爱情? 今天要介绍的这篇 ACL 2025 论文 ——《BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation》,聚焦于如何让 小说中的角色真正 "活" 起来,打造一个沉浸式的虚拟世界。 在BookWorld中,作者们提出了一个"小说->AI世界->故事创作"的系统。BookWorld能从小说中提取角色和世界观的数据,构建一个AI世界,让角色AI在 世界中进行长期的交互,自己创造自己的故事。为了实现流畅自然的长期交互,BookWorld建模了角色 ...
世界模型版《模拟人生》:AI虚拟小人街头演讲拉票,GPT-4o选举获胜
机器之心· 2025-06-21 04:36
机器之心报道 编辑:泽南、杨文 一个真实世界模拟器。 当世界模型高度进化后,里面的「人」都在做些什么? 有人会进行街头演说,吸引到了不少听众,小孩会和机器狗玩: 有人会当街作案,警察前去抓捕,又有人会在大庭广众之下求婚: 本周五,来自马萨诸塞大学阿默斯特分校(UMass Amherst)、约翰霍普金斯大学、卡耐基梅隆大学的研究者们提出了一个神奇的研究:虚拟社区 (Virtual Community)。 虚拟社区将真实世界的地理空间数据与生成模型相结合,为多种不同类型的智能体创建了一个具有社会根基的交互式、可扩展开放世界场景。 该工作昨晚提交,立即吸引了一些 AI 圈大佬的关注,纽约大学助理教授谢赛宁表示,这对于智能体研究来说意义重大。 虚拟社区提供了一个统一的框架,用于模拟社区中人类和机器人丰富的社交和物理互动。它建立在通用物理引擎之上,并以现实世界的 3D 场景作为基础。 作者为人类智能体实现了一个虚拟角色模拟框架,而其中的机器人模拟则主要继承自 Genesis。 虚拟社区通过在环境中填充配置机器人、人类角色配置文件和社会关系网络的智能体(由 LLM 提供支持)来支持基于 3D 场景的智能体社区生成。 这一 ...