智能体协作

Search documents
马斯克发布“地球最强AI模型”Grok 4:横扫所有榜单,在“人类最终测试”超越人类博士”!
AI科技大本营· 2025-07-10 07:14
北京时间 7 月 10 日,原定于上午 11 点的 xAI Grok 4 发布会,在万众瞩目中"鸽"了整整一小时。期间评论数飙升至 4200 条,转发超 2000 次,点赞 破万,140 万观众在线催更。这期间,xAI 的官推评论区成了大型许愿池和段子集散地。 作者 | 王启隆 出品 | CSDN(ID:CSDNnews) 毕竟,发布会前,老板马斯克亲自下场,在办公室搭帐篷、通宵达旦进行"最后一次大规模训练"的消息早已传遍网络。人们迫切想知道,是怎样的"核武 器",值得如此阵仗。 事实证明,这场等待是值得的。马斯克和他的团队带来的 Grok 4,不仅是一次模型的常规升级,更像是一场对现有 AI 能力边界的悍然宣告。 王座易主?Grok 4 制霸 大模型 考场 发布会的核心,首先是一系列令人瞠目结舌的基准测试(Benchmark)成绩。如果说过去的 AI 评测是诸神之战,那么 Grok 4 的登场,则 是 诸神黄昏 。 最引人注目的,无疑是"人类最终测试"(Humanity's Last Exam, HLE)的成绩。 这是一个涵盖了数学、有机化学、语言学、法学等多个博士级别难 题的超高难度测试,旨在检验 AI ...
师兄自己发了篇自动驾大模型,申博去TOP2了。。。
自动驾驶之心· 2025-07-09 12:56
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行自己的VLA、VLM方案。那么下一代大 模型需要关注的点有哪些呢? 按照早期自动驾驶技术发展的规律,当数据和方案基本验证有效后,开始重点关注轻量化与硬件适配、知识蒸馏与 量化加速、高效微调大模型等方向! 除此之外目前大火的CoT方案也是后期完成空间感知的重点,VLA+强化学习等高级推理范式也被行业重点关注。 这些问题是学术界和工业界亟需要解决的,相关的论文研究受到审稿人的青睐,国内外越来越多的团队正在从事相 关方向研究。我们了解到不少同学靠着自己的努力,发了篇和自动驾驶相关的大模型工作,申博去了TOP2!前面 收到很多同学的求助,希望能够辅助开展大模型相关的论文指导研究,解决无人带发论文,缺乏指导的痛点。 自动驾驶之心联合业内知名大模型方向学者,开展了1v6的大模型论文指导小班课,解决无人带、易踩坑、不知如 何写稿、投稿的难题。 ⼀、课程介绍⭐ 随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成为 ...
大模型在自动驾驶后期的落地与研究方向有哪些?
自动驾驶之心· 2025-07-07 23:31
大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行自己的VLA、VLM 方案。那么下一代大模型需要关注的点有哪些呢? 按照早期自动驾驶技术发展的规律,当数据和方案基本验证有效后,开始重点关注轻量化与硬 件适配、知识蒸馏与量化加速、高效微调大模型等方向! 除此之外目前大火的CoT方案也是后期完成空间感知的重点,VLA+强化学习等高级推理范式 也被行业重点关注。 这些问题是学术界和工业界亟需要解决的,相关的论文研究受到审稿人的青睐,国内外越来越 多的团队正在从事相关方向研究。前面收到很多同学的求助,希望能够辅助开展大模型相关的 论文指导研究,解决无人带发论文,缺乏指导的痛点。 自动驾驶之心联合业内知名大模型方向学者,开展了1v6的大模型论文指导小班课,解决无人 带、易踩坑、不知如何写稿、投稿的难题。 ⼀、课程介绍⭐ 解决只了解大模型相关零散知识,没有清晰的体系的问题,帮助系统掌握指定方向的重点理论知 识,同时做适当拓展,让学员对指定方向内容形成更清晰的体系; 解决没有方向,动手能力差,无法复现论文,帮助同学将模型理论与代码实践相结合,协助同学 开发设计新模型铺垫基础;能让学员将baseline深化拓 ...
MCP 已经起飞了,A2A 才开始追赶
AI前线· 2025-07-07 06:57
作者 | 李冬梅 采访嘉宾|郭伟、汪晟杰 6 月 24 日,谷歌云官宣将 A2A(Agent-to-Agent)协议捐赠给了 Linux 基金会,消息一出引发了 AI 行业地震。这份包含智能体交互协议、SDK 和开发者工具的开源礼包,背后站着亚马逊、微软、思 科等科技巨头组成的"全明星"阵容。 Google Cloud 副总裁兼商业应用平台总经理 Rao Surapaneni 表示:"通过与 Linux 基金会和领先的 技术提供商合作,我们将在值得信赖的开放治理框架下,实现更具创新性和价值的 AI 功能。" 在外界看来,谷歌云捐赠开源 A2A 的决策有点耐人寻味。在 Reddit 平台,有评论认为谷歌这么做是 对 Anthropic MCP 协议、OpenAI 函数等竞品的战略应对,但同时也揭示了行业共识:智能体经济需 要共建底层规则。 也有用户认为,MCP 已经起飞了,A2A 才开始追赶。 甚至有人厌倦了谷歌,认为 A2A 不会成功。 在 A2A 协议引发热议的同时,MCP 已经在企业级市场悄然生根。与 A2A 侧重智能体间通信不同, MCP 解决的是更基础的问题:如何让 AI 模型安全高效地调用现实世界中 ...
大模型这个坑,还有哪些可以发论文的点?
具身智能之心· 2025-07-05 02:25
随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成 为当前人工智能研究的核心议题。我们联合业界知名大模型专家,为大家退出了大模型1v6论文辅导小班课! ⼀、有关大模型核心的几个点⭐ 本课程系统性地探讨大模型的前沿优化方法,重点研究参数高效计算、知识动态扩展和复杂推理三大方向的关键 技术。我们将深入分析大模型优化中的核心挑战:在参数压缩方面,研究剪枝稀疏化和量化加速等轻量化方法; 在知识扩展方面,探索检索增强生成(RAG)和参数高效微调(PEFT)等动态知识注入技术;在推理优化方 面,研究链式思维(CoT)和强化学习优化(GRPO)等高级推理范式。同时,课程还将探讨多智能体协作和多 模态理解等前沿方向。 通过本课程的学习,你将掌握大模型优化的核心算法,包括但不限于:结构化剪枝、低比特量化、动态检索、角 色化智能体、多跳推理等关键技术。课程采用理论讲解与实验实践相结合的方式,使用主流大模型(如 LLaMA、GPT等)作为实验平台,重点培养学生在模型优化和推理增强方面的研究能力。 关键词:大模型优化;参数高效计算;检索增强生成;链式推理;多智能体协作;多模态理解 ⼆、 ...
下一代大模型高效计算:参数压缩、硬件适配与多模态推理、CoT等方向论文指导班来啦!
自动驾驶之心· 2025-07-04 07:13
⼀、课题简介⭐ 随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成 为当前人工智能研究的核心议题。本课程系统性地探讨大模型的前沿优化方法,重点研究参数高效计算、知识动 态扩展和复杂推理三大方向的关键技术。 课程将深入分析大模型优化中的核心挑战:在参数压缩方面,研究剪枝稀疏化和量化加速等轻量化方法;在知识 扩展方面,探索检索增强生成(RAG)和参数高效微调(PEFT)等动态知识注入技术;在推理优化方面,研究 链式思维(CoT)和强化学习优化(GRPO)等高级推理范式。同时,课程还将探讨多智能体协作和多模态理解 等前沿方向。 通过本课程的学习,你将掌握大模型优化的核心算法,包括但不限于:结构化剪枝、低比特量化、动态检索、角 色化智能体、多跳推理等关键技术。课程采用理论讲解与实验实践相结合的方式,使用主流大模型(如 LLaMA、GPT等)作为实验平台,重点培养学生在模型优化和推理增强方面的研究能力。 关键词:大模型优化;参数高效计算;检索增强生成;链式推理;多智能体协作;多模态理解 ⼆、课程目的 三、招生人数⭐ 6⼈/期(⾄多8人) 四、招生对象⭐ 五、课程收获 解决 ...
智能体不断进化,协作风险升高:五大安全问题扫描
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-03 00:36
Core Insights - The year 2025 is anticipated to be the "Year of Intelligent Agents," marking a paradigm shift in AI development from conversational generation to automated execution, positioning intelligent agents as key commercial anchors and the next generation of human-computer interaction [1] Group 1: Development and Risks of Intelligent Agents - As intelligent agents approach practical application, the associated risks become more tangible, with concerns about overreach, boundary violations, and potential loss of control [2] - A consensus exists within the industry that the controllability and trustworthiness of intelligent agents are critical metrics, with safety and compliance issues widely recognized as significant [2] - Risks associated with intelligent agents are categorized into internal and external security threats, with internal risks stemming from vulnerabilities in core components and external risks arising from interactions with external protocols and environments [2] Group 2: AI Hallucinations and Decision Errors - Over 70% of respondents in a safety awareness survey expressed concerns about AI hallucinations and erroneous decision-making, highlighting the prevalence of factual inaccuracies in AI-generated content [2] - In high-risk sectors like healthcare and finance, AI hallucinations could lead to severe consequences, exemplified by a hypothetical 3% misdiagnosis rate in a medical diagnostic agent potentially resulting in hundreds of thousands of misdiagnoses among millions of users [2] Group 3: Practical Applications and Challenges - Many enterprises have found that intelligent agents currently struggle to reliably address hallucination issues, leading some to abandon AI solutions due to inconsistent performance [3] - A notable case involved Air Canada's AI customer service, which provided incorrect refund information, resulting in the company being held legally accountable for the AI's erroneous decision [3] Group 4: Technical Frameworks and Regulations - Intelligent agents utilize various technical bridges to connect with the external world, employing two primary technical routes: an "intent framework" based on API cooperation and a "visual route" that bypasses interface authorization barriers [4] - Recent evaluations have highlighted chaotic usage of accessibility permissions by mobile intelligent agents, raising significant security concerns [5] Group 5: Regulatory Developments - A series of standards and initiatives have emerged in 2024 aimed at enhancing the management of accessibility permissions for intelligent agents, emphasizing user consent and risk disclosure [6] - The standards, while not mandatory, reflect a growing recognition of the need for safety in the deployment of intelligent agents [6] Group 6: Security Risks and Injection Attacks - Prompt injection attacks represent a core security risk for all intelligent agents, where attackers manipulate input prompts to induce the AI to produce desired outputs [7][8] - The emergence of indirect prompt injection risks, particularly with the rise of MCP (Multi-Channel Protocol) tools, poses new challenges as attackers can embed malicious instructions in external data sources [8][9] Group 7: MCP Services and Security Challenges - The MCP service Fetch has been identified as a significant entry point for indirect prompt injection attacks, raising concerns about the security of external content accessed by intelligent agents [10] - The lack of standardized security certifications for MCP services complicates the assessment of their safety, with many platforms lacking rigorous review processes [11] Group 8: Future of Intelligent Agent Collaboration - The development of multi-agent collaboration mechanisms is seen as crucial for the practical deployment of AI, with various companies exploring the potential for intelligent agents to work together on tasks [12][13] - The establishment of the IIFAA Agent Security Link aims to provide a secure framework for collaboration among intelligent agents, addressing issues of permissions, data, and privacy [14]
百度心响上线iOS版,多智能体协作应用终于卷对地方了
量子位· 2025-05-27 03:53
小明 发自 凹非寺 量子位 | 公众号 QbitAI 今年的4月26日, 我们测评了百度新发布的多智能体协作应用心响APP 。当时只上线了安卓版,很多网友在线求苹果版链接。 就在这几天, iOS版也终于上线了 ,只需要在苹果的APP Store搜索关键词即可下载。 现在,苹果安卓用户全部免费用,完全不限量! 在第一时间体验了iOS版心响APP,我们基本上可以下一个判断:智能体应用,终于卷对地方了。 不仅体验门槛低——苹果安卓用户,下载APP就能用, 无需邀请码、每天不限次数 。 而且玩法超全,各类火热的智能体玩法,这一个APP就够用了。 比如定制一个北京游玩攻略,向智能体提出具体的需求,它便能自己拆解任务、调用多个智能体生成对应的方案,甚至四天游玩的路线都基于 地图MCP清晰呈现了出来。 最近智能体真的太火了,各种APP都在接入,让普通人眼花缭乱。 但实际使用还是有很多gap,比如邀请码、用量限额、能力不全面等,导致实际体验受影响。 现在,一个APP,把上述问题都搞定了。 具体体验,来看量子位一手实测。 全能自主的AI搭子 我们具体实测了旅游攻略、深度研究、法律咨询、试题讲解几大场景。 最近很火热的 深度研究 ...
AgentUnion发布智能体通信协议ACP
Sou Hu Cai Jing· 2025-05-17 06:25
ACP是AgentUnion提出的一套开放协议,用于解决Agent互相通信协作的问题,以达到Agent功能复用, 效率最优的目标,使企业和开发者可以用最低成本开发出可用于生产级部署的Agent应用。 ACP定义了一系列Agent协议规范,包含:Agent的身份标识及其标准入口、Agent接入智能体互联网的 机制、Agent的数据规范、Agent的通信协议、Agent的授权体系规范、Agent行为以及安全规范,确保了 Agent之间的开放性、可靠性、可协作性。 简单说,ACP 让不同 AI 之间可以自由打招呼、分工协作、共享技能。比如,一个做翻译的 Agent,能 自动调用另一个做语音合成的 Agent,再一起对接日程管理 Agent,为你完成"多语言会议摘要播报"的 复杂任务——就像一支高效的"数字团队"。 ACP主要架构与概念 AID 智能体身份标识 a.每一个智能体在网络中有一个唯一的身份标识:AID(Agent Identifier),Agent接入智能体互联网,首先 必须申请一个AID。 b. AID是通过接入点泛域名解析得到的二级域名,Agent之间通过AID来找到对方,并进行通信。 2025年5月 ...
百度李彦宏:帮助开发者全面拥抱MCP
Guang Zhou Ri Bao· 2025-04-27 19:06
过去一年,大模型世界风云变幻。大模型厂商之间的竞争,令开发者不敢放心大胆做应用。李彦宏对开 发者说,"只要找对场景,选对基础模型,有时候还要学一点调模型的方法,在此基础上做出来的应用 是不会过时的"。他强调,"没有应用,芯片、模型都没有价值。模型会有很多,但应用才是王者。" 超出市场预期的是,百度在Create开发者大会上连发两大模型:文心大模型4.5 Turbo和文心大模型X1 Turbo,具备多模态、强推理、低成本三大特性。具体而言,文心4.5 Turbo,相比文心4.5,价格下降 80%;文心X1 Turbo,相比文心X1,在性能提升的同时价格再降50%。 李彦宏认为,当前开发者做AI应用的一大阻碍,就是大模型成本高、用不起。成本降低后,开发者和 创业者们才可以放心大胆地做开发,企业才能够低成本地部署大模型,最终推动各行各业应用的爆发。 文心X1 Turbo是基于4.5 Turbo的深度思考模型,在性能提升的同时,具备更先进的思维链,问答、创 作、逻辑推理、工具调用和多模态能力进一步增强。"有了这样超级能干的基础模型,我们就可以打造 出超级有用、超级有趣的AI应用来。"李彦宏表示。 一年一度的Creat ...