Layering every technique in RAG, one query at a time - David Karam, Pi Labs (fmr. Google Search)
AI Engineer·2025-07-29 14:30
RAG技术栈 - RAG技术栈范围从最简单的内存嵌入和相关性排序搜索,到最复杂的行星级搜索,后者包含70多种语料库混合,包括token、embeddings和知识图谱[1] - 行业正在探索在200毫秒内以每秒16万次查询的速度,对这些混合语料库进行联合检索、自定义排序、联合重排序和LLM处理[1] - 报告通过“一次一个查询”的方式,逐步增加复杂性,展示RAG中所有技术的局限性,以及下一层技术在处理更复杂查询方面的能力[1] 搜索挑战 - 某些搜索问题非常难以解决,以至于行业可能更倾向于将问题交给LLM或UX处理[1] - 报告指出,像[falafel]这样的查询非常难以搜索,而对文档进行分块可能会是灾难性的[1] 行业应用与洞察 - Google团队在50多个搜索产品(包括Google.com和定制企业搜索)的背景下,分享了RAG技术的应用经验[1] - Pi Labs 致力于将Google在搜索核心AI和NLU系统方面的工作经验带给整个行业[1]