检索增强生成(RAG)

Search documents
速递|OpenAI高管押注:25岁工程师重构AI检索底层逻辑,YC新秀ZeroEntropy获420万美元种子轮
Z Potentials· 2025-07-10 04:12
图片来源: ZeroEntropy 随着生成式 AI 重塑各行各业,其最重要却无形的挑战之一便是检索——从杂乱的知识库中获取带有 相关背景的正确数据。大型语言模型( LLMs )的准确性完全取决于它们能检索到的信息。 这正是 ZeroEntropy 希望大展拳脚的地方。这家总部位于旧金山的初创公司由 CEO Ghita Houir Alami 和 CTO Nicholas Pipitone 联合创立, 已获得 420 万美元种子轮融资,旨在帮助 AI 模型实现 快速、准确且大规模的相关数据检索。 这意味着, 不同于 Glean 这类面向企业员工的搜索产品—— ZeroEntropy 是纯粹的开发者工具。它能 快速抓取数据,甚至能处理混乱的内部文档。创始人 Houir Alami 将她的初创公司比作 " 搜索界的 Supabase" ,后者是通过自动化简化数据库管理的热门开源项目。 " 目前,大多数团队要么在拼凑市场上的现有工具,要么将整个知识库直接塞进 LLM 的上下文窗 口。 " 侯伊尔·阿拉米表示, " 第一种方法构建和维护耗时费力,第二种方法可能导致错误累积。我们正在打 造开发者优先的搜索基础设施——可 ...
全模态RAG突破文本局限,港大构建跨模态一体化系统
量子位· 2025-06-26 03:43
RAG-Anything团队 投稿 量子位 | 公众号 QbitAI 突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。 香港大学黄超教授团队开源多模态智能处理系统RAG-Anything,将碎片化的信息孤岛转化为结构化的知识网络,为智能多模态文档分析开辟 了全新技术路径。 人工智能正在从只会处理文字发展到能够理解多种信息形式,这种变化其实很符合日常工作的实际情况。人们平时接触的信息很少是纯文字 的,更多的是包含图片、表格、图表的综合性文档。这些不同类型的内容——文字说明、图像展示、数据分析、逻辑推理等——相互配合,形 成了一个完整的信息体系。 在各个专业领域里,多模态内容早就成为主流的信息传递方式。学术论文需要用图表和公式来展示研究成果,教学材料用图解让概念更好理 解,财务报告靠各种图表来展现数据变化,医疗记录则包含大量的影像和检测数据。这些视觉化的内容和文字说明互相补充,构成了完整的专 业知识框架。 面对如此复杂的信息形态,传统的单一文本处理方式已无法满足现实各类场景的需求。各行业都迫切需要AI系统具备跨模态的综合理解能力, 能够同时解析文字叙述 ...
卡内基梅隆大学团队:如何全面检测RAG系统鲁棒性?
Sou Hu Cai Jing· 2025-06-08 02:53
| Yixiao Zeng | Tianyu Cao | Danging Wang | | --- | --- | --- | | Carnegie Mellon University | Carnegie Mellon University | Carnegie Mellon University | | jackz@andrew.cmu.edu | tianyuca@andrew.cmu.edu | dangingwandrev cmu.edu | | Xinran Zhao | Zimeng Oiu | Morteza Ziyadi | | Carnegie Mellon University | Amazon | Amazon | | xinranz3@andrey.cmu.edu | zimengqi@amazon.com | mziyadi@amazon.com | | Tongshuang Wu | | Lei Li | | Carnegie Mellon University | | Carnegie Mellon University | | sherryw@andrew.cmu.edu | ...
领域驱动的 RAG:基于分布式所有权构建精准的企业知识系统
Sou Hu Cai Jing· 2025-05-22 13:37
作者 | George Panagiotopoulos 译者 | 明知山 策划 | 丁晓昀 我们的背景 作为一家在银行技术领域拥有超过 30 年行业经验的领军供应商,我们拥有丰富且极具创新性的代码库,并通过战略性收购不断扩大业务。多年来,我们 一直将自己定位为行业的创新者,但创新的迅猛步伐也为我们带来了在庞大产品线中保持文档一致性与时效性的挑战。 虽然我们代码库的部分模块拥有坚实且管理得当的文档,但仍有部分模块存在文档不清晰或内容过时的问题,这导致我们的销售工程师和客户架构师很难 找到所需的信息。此外,我们的领域专家在各自的专业领域拥有深厚的知识和丰富的经验,但这些宝贵的专业知识往往分散且孤立,难以被系统地整合和 获取。 此前,我们曾尝试通过知识共享计划和培训项目来解决这一问题,但由于文档分散和专业知识孤立,这些努力的效果并不理想。我们还尝试引入基于静态 预定义问题和答案数据库的事实查找工具。然而,这些工具在使用过程中面临一个重大挑战——缺乏上下文信息。通常情况下,如果问题本身或其上下文 (或两者)稍有不同,针对特定问题在特定上下文中的答案就难以复用。为了克服这些获取准确技术信息的障碍,我几个月前决定探索使用 ...
OpenAI:GPT-5就是All in One,集成各种产品
量子位· 2025-05-17 03:50
一水 发自 凹非寺 量子位 | 公众号 QbitAI GPT-5将会集大成于一体?! 就在发布"最强编程智能体Codex"之后 ,OpenAI又接着在Reddit举行了 "有问必答"活动 。 公司研究副总裁Jerry Tworek,剧透了下一代基础模型GPT-5的最新消息: 为了减少模型切换,未来计划将Codex、Operator、Deep Research和Memory整合在一起 。 Q3 : 团队在使用Codex时,发现了哪些与目前的"氛围编码(vibe coding)"不同的范式转变?开发这个工具的灵感是什么? 除此之外,其他Codex团队成员也纷纷开启了爆料模式,比如: Okk,下面我们一起吃瓜。 回应10大重点问题 Codex最初只是一个附带项目,启动原因是他们意识到在内部工作流中未充分利用好模型; 内部在使用Codex时,编程效率提升了约3倍; OpenAI正在探索灵活的定价方案,包括按需付费; o3-pro或codex-1-pro最终将在团队能力允许的情况下推出; …… 整体而言,OpenAI团队这次主要分享了Codex的详细情况,以及公司未来的发展计划。 为了尽量贴合问答者原意,我们直接以对话 ...
李彦宏说 DeepSeek 幻觉高,是真的吗?
3 6 Ke· 2025-05-02 04:29
李彦宏点名批评DeepSeek幻觉高。这回,他真的没错。但大模型的幻觉问题,又远非错与对那么简单。 DeepSeek-R1作为今年年初的新晋国产开源大模型,以强大的推理能力和更懂国人的文笔,在苹果美区App免费下载排行榜上力压ChatGPT一头,甚至一 度成为"AI"的代言词。 然而,自从R1席卷全网后,关于它经常"胡说八道"的批评就不绝于耳,比如它实在太能编了,让人真真假假分不清。 除了用户端之外,李彦宏及其代表的大厂们也"苦"DeepSeek已久:一方面,大厂不得不依赖DeepSeek的泼天流量导入自身门户入口;另一方面,尽管投入 大量人力物力研发深度推理模型,其成果却难以突破用户心智。 在2025百度AI开发者大会的开幕上,李彦宏直接点出全民AI大模型 DeepSeek-R1 的痛点:"只支持单一模态、幻觉率较高、又慢又贵"。一番犀利评论, 再度引发了各界对DeepSeek-R1以及大模型"幻觉"的评议。 但出现强烈幻觉的并不止DeepSeek一家,OpenAI在其内部测试中发现:o3/o4-mini虽然全面替换了o1系列,但是幻觉现象越来越强了;国内第一个混合推 理模型——阿里通义的Qwen3也在X上 ...
最新!2025医疗AI应用趋势全解析
思宇MedTech· 2025-02-13 08:11
自ChatGPT首次发布至今已逾两年,期间人工智能(AI)已逐渐成为生成式人工智能(generative AI)的代名词。当下,提及AI,多数人首先想到的是大型语言模型 (LLMs)及其相关聊天机器人。这反映出生成式AI对各行业乃至全球普通人的深远影响,医疗领域亦不例外。 技术应用过程 实时聆听与分析: 在患者与临床医生的对话过程中,环境聆听技术能够实时捕捉对话内容,并通过语音识别技术将其转化为文本。 信息提取与整理: 系统会自动识别对话中的关键信息,如患者的症状、医生的诊断意见等,并将其整理成临床笔记。 在医疗领域,AI在改善临床及管理工作流程方面的巨大潜力使其备受关注。2024年,早期应用AI技术的企业、医疗机构等已充分体会到了AI的诸多可能性。 到2025年,预计医疗机构对AI项目的风险容忍度将有所提高,从而推动AI的进一步应用。也将更加谨慎地选择那些能够满足业务需求、提升效率或实现成本节约的 解决方案。 下文将汇总部分2025年医疗机构可能采用AI的几种方式,供读者参考。 环境聆听AI技术 01 环境聆听是一种基于机器学习的音频解决方案,通过语音识别技术,能够实时捕捉并分析医疗场景中的对话内容。这种技 ...