上下文工程

Search documents
DeepSeek流量暴跌,全球AI霸主地位遇滑铁卢;90后开发者6个月狂赚8000万;人形机器人A轮5亿融资|混沌AI一周焦点
混沌学园· 2025-07-11 07:55
本周AI商业焦点必读 (2025.7.3-7.9) 本周核心趋势 2025年7月6日 1、 「 混沌AI商业实战全国巡讲 」 顺利开启,巡讲火热进行中! 当AI浪潮席卷而来,混沌再次"早半步",点燃实战火炬! 混沌AI商业实战全国巡讲 正式启程,计划点亮全国20座创 新城市!7月6日长沙、7月8日南昌已顺利举行,接下来三站是:7月10日福州、7月12日广州、7月20日苏州!这 一次,混沌只邀请 "躬身入局者" ! 商学院顶尖教授联手身经百战的AI实战家、企业业务1号位,组成 "混沌AI领教 天团" 。欢迎参与巡讲。 具身智能资本爆发: 融资额激增,美团等投资加速机器人商业化进程,显示具身智能赛道火热。 AI应用门槛降低 :开源模型与上下文工程再降门槛,颠覆式创新赋能普通人,让AI创新更容易。 垂直行业AI渗透: AI制药、数字人重构医疗、直播产业,生活服务或迎来变革。 竞争策略创新: 透明构建+激励体系驱动用户裂变增长方式具备参考学习价值。 企业AI标准化: 成熟度模型加速智能化转型。飞书发布首个AI应用成熟度标准,帮助企业评估和选择AI应用, 加速智能化进程。 混沌AI商业实战全国巡讲: 火热进行中!本周已 ...
7月19日,相聚北京!一起聊聊ACL 2025爆点研究
机器之心· 2025-07-10 08:35
2025 年,AI 领域依旧是让人兴奋的一年。在这一年中,各大科技公司、机构发布了数不胜数的研究。 从年初的 DeepSeek,到最近的视频生成模型 Veo 3,我们见证了 AI 一轮又一轮的轰炸,AI 给我们带来了意想不 到的惊喜。 而更令人震撼的是,这样的惊喜几乎每隔几周、甚至几天就会出现一次。 模型刚刚上线还没用熟,下一个技术范式就已经在 arXiv 或 GitHub 上悄然登场。技术更新的节奏,快得让人几 乎来不及适应。 在这样一个跟不上就会掉队的时代,越来越多开发者、研究员、AI 从业者开始主动蹲顶会、刷论文、看分享, 只为第一时间捕捉前沿研究。 作为 NLP 领域最具影响力的会议之一,ACL 每年都吸引了广大学者参与。今年 ACL 总投稿数高达 8000 多篇, 创历史之最。今年 ACL 2025 将于 7 月 27 日 - 8 月 1 日在奥地利维也纳开幕。 作为一场为国内 AI 人才打造的盛会,本次论文分享会设置了 Keynote、论文分享、圆桌对话、Poster 交流及企 业展位交流等丰富环节。今天,论文分享会的全日程、Keynote 分享嘉宾及演讲主题正式公布,感兴趣的读者可 以继续扫描文 ...
苹果开发者自曝用Claude完成95%开发,开发应用已上架
量子位· 2025-07-07 09:35
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 苹果开发者自曝用AI开发应用程序, Claude含量95% ! 事情是这样的,一位苹果开发者最新发布了一款用于调试MCP服务器的原生macOS应用 Context —— 一款几乎完全由 Claude Code 构建的应用程序。 作者 indragiek 从2008年就开始为Mac开发软件。 这次,他的目标是使用Apple的SwiftUI框架,打造一款在macOS平台上使用起来很顺手且实用的开发者工具。 与以往不同的是,Claude Code承担了Context项目95%的工作量,indragiek声称: 在这个 20000行 代码的项目中,我亲手编写的代码估计 不到1000行 。 "工程师"Claude也是好起来了,能给苹果打工(doge)。 调侃归调侃,下面让我们来"学习"一下这位开发者是怎么用Claude的。 苹果开发者教你"驯服"Claude 作为一名经验丰富的工程师,Indragie像许多同行一样,拥有一个"烂尾项目"list。 尽管能够构建项目原型,但最后20%的交付工作往往耗费巨大时间和精力,导致项目搁置。 所以,他已经6年未能成功发布任何一个 ...
腾讯研究院AI速递 20250707
腾讯研究院· 2025-07-06 14:05
生成式AI 一、 Grok 4逆天跑分泄露,「人类最后考试」豪取45%全场第一 ? 1. Grok 4在「人类最后考试」(HLE)测试中得分高达45%,远超Gemini 2.5 Pro和Claude 4 Opus, 引发 讨论 ; 2. 马斯克表示Grok 4以「第一性原理」构建推理机制,像物理学家那样思考,从基本公理层 面分析问题; 3. Grok 4将强化编码能力, 或 分为Grok 4和Grok 4 Code两个版本,预计在7月4日后随时 发布。 https://mp.weixin.qq.com/s/kuk8MfUW_wbS5RAOdV24ZA 二、 Gemini CLI 重磅更新:将 支持音视频处理,与 多项体验升级 1. Gemini CLI 发 布 更新支持音视频输入功能,显著扩展多模态交互能力 ; 实则 目前仅能 处理文本、图片和PDF文件; 2. 增强Markdown功能,新增表格渲染与文件导入功能,并集成VSCodium和Neovim编辑 器,提升开发体验; 3. 技术栈升级至Ink 6和React 19,添加新主题、隐私管理功能,并优化历史记录压缩算法, 提高性能和稳定性。 四、 开源De ...
Karpathy:我不是要造新词,是「上下文工程」对 Agent 来说太重要了
Founder Park· 2025-07-04 13:10
Core Viewpoint - The concept of "Context Engineering" has gained traction in the AI industry, emphasizing that the effectiveness of AI applications relies more on the quality of context provided than on the prompts used to query the AI [1][3]. Group 1: Definition and Importance of Context Engineering - Context Engineering is defined as the discipline of designing and constructing dynamic systems that provide appropriate information and tools to large language models (LLMs) at the right time and in the right format [19]. - The quality of context provided to an AI agent is crucial for its effectiveness, surpassing the complexity of the code or framework used [24]. - A well-constructed context can significantly enhance the performance of AI agents, as demonstrated by examples where rich context leads to more relevant and useful responses [25]. Group 2: Components of Context Engineering - Context Engineering encompasses various elements, including prompt engineering, current state or dialogue history, long-term memory, and retrieval-augmented generation (RAG) [15][11]. - The distinction between prompts, prompt engineering, and context engineering is clarified, with prompts being the immediate instructions given to the AI, while context engineering involves a broader system that dynamically generates context based on task requirements [15][19]. Group 3: Strategies for Implementing Context Engineering - Four common strategies for implementing Context Engineering are identified: writing context, selecting context, compressing context, and isolating context [26]. - Writing context involves saving information outside the context window to assist the agent in completing tasks, such as maintaining a calendar or email history [28][29]. - Selecting context refers to pulling necessary information into the context window to aid the agent, which can include filtering relevant memories or examples [36][38]. - Compressing context focuses on retaining only the essential tokens needed for task execution, often through summarization techniques [43][44]. - Isolating context involves distributing context across multiple agents or using environments to manage context effectively, enhancing task focus and reducing token consumption [47][50].
登上热搜!Prompt不再是AI重点,新热点是Context Engineering
机器之心· 2025-07-03 08:01
机器之心报道 编辑:+0 最近 「 上下文工程 」 有多火?Andrej Karpathy 为其打 Call,Phil Schmid 介绍上下文工程的文章成为 Hacker News 榜首,还登上 了知乎热搜榜。 之前我们介绍了 上下文工程的基本概念 ,今天我们来聊聊实操。 为什么关注「上下文工程」 我们很容易将 LLM 拟人化——把它们当作能够「思考」、「理解」或「感到困惑」的超级助手。从工程学的角度来看,这是一个根本性 的错误。LLM 并不具备信念或意图,它是一个智能的文本生成器。 更准确的看法是:LLM 是一个 通用的、不确定的 函数。这个函数的工作方式是:你给它一段 文本(上下文) ,它会生成一段新的 文 本(输出) 。 通用 : 意味着它能处理各种任务(如翻译、写代码),无需为每个任务单独编程。 不确定 : 意味着同样的输入,每次可能得到稍有不同的输出。这是它的特点,不是毛病。 无状态 : 意味着它没有记忆。你必须在每次输入时,提供所有相关的背景信息,它才能「记住」对话。 这个视角至关重要,因为它明确了我们的工作重心:我们无法改变模型本身,但可以完全 控制输入 。所有优化的关键,在于如何构建最 有效 ...
上下文就是一切!行业热议话题:提示工程是否应该改名
歸藏的AI工具箱· 2025-06-26 11:40
大家好,我是歸藏(guizang),今天来讨论一下最近圈子很火的上下文工程概念。 这几天 AI 圈子有个非常有必要也非常热的讨论就是提示工程是不是应该被称为"上下文工程"更加适合。 最早由 Shopify CEO Tobi Lutke 在推特说,他觉得相比提示工程更喜欢"上下文工程"这个术语。 因为这个词可以更加准确的描述岗位所需要的核心技能: 需要为 LLM 提供完成任务所需要的所有上下文。 之后 Andrej Karpathy 也发表了意见,"提示"通常让人联想到日常使用的 LLM 聊天机器人中的简短任务描 述。 但是在每一个工业级 LLM 应用中,上下文工程是精心艺术和科学地填充上下文窗口, 使其包含下一步所需 恰到好处的信息 。 因为做到这一步需要的不只是提示词这一个东西,还需要任务描述和解释、少量样本、RAG(检索增强生 成)、相关的(可能是多模态)数据、工具、状态和历史、以及压缩等信息。 如果信息太少或形式不对,LLM 可能无法获得最佳性能所需的正确上下文。 但如果信息过多或不相关,LLM 的成本可能会上升,性能也可能下降。 所以上下文工程师需要提供恰到好处的信息,而且这需要对 LLM"心理"有一 ...
提示词工程、RAG之后,LangChain:上下文工程开始火了!
机器之心· 2025-06-25 04:06
机器之心报道 编辑:陈萍 AI 时代,你可能听说过提示词工程、RAG、记忆等术语。但是很少有人提及 上下文工程(context engineering) 。 其实,这一术语并不新鲜,近两年很多智能体构建者一直在关注这个事情。至于重要性,下面这张图很好 地概括了上下文工程与提示词工程、RAG 等的关系。 在传统的提示工程中,开发者通常侧重于精心设计提示语,以期得到更好的答案。然而,随着应用的复杂 度不断增加,逐渐显现出单纯依赖提示已无法满足现代智能体的需求。如今,提供完整且结构化的上下文 信息比任何巧妙的提示词更为重要。 因此,上下文工程正在成为 AI 工程师可以发展的最重要技能。 什么是上下文工程? 上下文工程是指构建动态系统,以合适的格式提供准确的信息和工具,使 LLM 能够合理完成任务。 上下文工程是一个系统 。复杂的智能体可能需要从多个来源获取上下文。这些上下文可能来自应用开发 者、用户、先前的交互记录、工具调用结果或其他外部数据。将这些内容整合起来需要一个复杂的系统。 上下文工程是动态的 。许多上下文信息是动态生成的。因此,构建最终提示的逻辑也必须是动态的,而不 仅仅是一个静态模板。 上下文工程就是为 ...
近期必读!Devin VS Anthropic 的多智能体构建方法论
歸藏的AI工具箱· 2025-06-15 08:02
播客内容由 listenhub 生成,懒得看的话也可以听 昨天最热的的两篇文章是关于多智能体系统构建的讨论。 先是 Anthropic 发布了他们在深度搜索多智能体构建过程中的一些经验,具体:包括多智能体系统的优势、架构概览、提示工程与评估、智能体的有效评估等方 面。 另外一边 Devin 的开发商 Cognition 的一个负责人 Walden 发布文章告诫大家不要构建多智能体,指出一些常见但实际效果不佳的方法,特别是多智能体架构的弊 端。 这篇文章主要就是结合两篇文章看一下 Cognition 提到的多智能体架构弊端和 Anthropic 给出的解决方案 。同时后面也会有两篇文章非常详细的总结。 什么是多智能体 多智能体系统由多个智能体(大型语言模型 [LLM] 自主地循环使用工具)协同工作组成。 在这种系统中,一个主智能体(或协调器)会根据用户查询规划研究过程,然后使用工具创建并行操作的子智能体,这些子智能体同时搜索信息。这种架构允许主 智能体协调整个过程,同时将任务委托给专门的子智能体。 所以具体的步骤一般为: 1. 将工作分解为多个部分 首先是领域选择: 他们将多智能体系统应用于他们认为特别适合并行 ...