向量数据库

Search documents
Qdrant CEO解析AI为何需要专用向量搜索技术
Sou Hu Cai Jing· 2025-06-17 14:52
Qdrant是一家开源向量数据库初创公司,拥有超过1000万次安装量。我们与创始人兼CEO Andre Zayarni 进行了对话,深入了解Qdrant与通用数据库的差异化优势。 AI管道需要处理结构化、文件和对象数据。Zayarni指出,AI管道越来越关注非结构化数据——文件、 文档、图像和代码,这些构成了模型训练和实时推理任务的骨干。结构化数据(如元数据)通常用于标 记、过滤或组织内容,以实现更好的检索和控制。 向量化与存储策略 关于数据向量化,Zayarni建议使用与任务和领域相匹配的嵌入模型。一旦转换为向量,这些数据变得 庞大、固定大小且在计算上密集。"通用数据库从根本上不适合高维相似性搜索,它们缺乏实时大规模 检索所需的索引结构、过滤精度和低延迟执行路径。" 相比之下,专用向量数据库专为此挑战而构建,提供一阶段过滤、混合搜索、量化和智能查询规划等功 能。 部署环境选择 AI数据管道的核心阶段 在谈到AI训练和推理数据管道时,Zayarni强调区分训练和推理的重要性。"训练管道负责准备原始数据 以微调或预训练基础模型,而推理管道专注于将这些模型应用到实际任务中。"向量搜索是推理阶段的 核心:从相关数据 ...
海量数据20250605
2025-06-06 02:37
海量数据 20250605 摘要 公司 2025 年前四个月在手订单总额持续增长,已进入多个省级框架采 购订单,并在运营商、金融、制造等行业取得突破,新增客户包括兴业 银行和长江存储,央企及资源行业也签约新客户和订单。 向量数据库产品已与金融、政务及医疗行业客户进行大模型适配和测试, 预计年底产生收入贡献,2025 年收入目标为 5 亿元,目前符合预期。 党政信创领域取得显著突破,三线地区受益于十三号文补贴政策,采购 意愿提升,一二线地区台账报送良好,核心系统新增需求集中于政务云 平台、人保社保系统及纪委监察系统等。 核心系统方面,ERP、CRM、风控及战略决策系统应用范围扩大,尤其 在生产制造领域,运营商订单增加,行业信创显著提升。 金融行业受替换政策影响较小,资金充裕,贡献较大收入;普通央企和 制造商替换意愿高,与公司合作深入,如国开集团和国投集团已签订长 期框架协议。 2025 年第一季度自主数据库比例显著提升,4 月份突破 60%,预计第 二、三季度毛利率将优于第一季度。全年营收目标 5 亿元,面临行业增 长和政策红利机遇。 公司研发投入稳定在 2 亿元左右,研发人员 400 余人。销售团队扩充, 销 ...
135 个项目、七大趋势、三大赛道:撕开大模型开源生态真相,你会怎么卷?
机器之心· 2025-05-29 07:10
机器之心原创 编辑:吴昕 不要抗拒趋势 在微软 Build 、谷歌 I/O 、 Code with Claude 三大开发者大会接连登场的一周里,微软为 Windows 加装模 型上下文协议( MCP ), Google Gemini 野心初显「 AI 操作系统」, Claude 4.0 高调抢滩编程主战场。 就在这样的节奏下, 5 月 27 日,蚂蚁集团的开源团队「接棒」发布了一张《 2025 大模型开源开发生态全景 图》。 访问地址: https://antoss-landscape.my.canva.site 完整项目列表和相关数据: https://docs.google.com/spreadsheets/d/1av9kitgnRGtsmDp6AbW96m2cCR4jXZFQmUVG2di8Bjw/edit? gid=0#gid=0 这是一张由开源社区数据驱动的技术演进路线图—— 135 个社区核心项目、 19 个技术领域, 全面覆盖从智能体应用到模型基建,系统性梳理了开源力量在大模型浪 潮下的集结与演化路径。 其中, 模型训练框架、高效推理引擎、低代码应用开发框架 成为当前最具主导力的三条技术赛道。 ...
计算机行业动态报告:重估数据库:未来软件=Agent+数据库
Minsheng Securities· 2025-05-06 03:42
计算机行业动态报告 重估数据库:未来软件=Agent+数据库 2025 年 05 月 06 日 ➢ DB for AI:AI Agent 推动软件形态变革,数据库具有不可替代的重要地 位,赋能 AI 发展。1)AI Agent 有望通过直接与终端互动,在一定程度上替代 中间应用层软件:在传统软件架构中,应用程序充当用户与数据库之间的"中间 商"。用户通过应用操作,请求经前端发至后端,后端查询数据库、执行逻辑后, 再将结果返回前端。而在 AI 驱动的新模式下,智能 Agent 能够直接与数据库进 行交互,实现数据的创建、读取等功能,进而可能代替中间应用层。 2.计算机周报 20250426:计算机行业 2025 Q1 持仓分析:机构持仓处历史底部,集中度 进一步提升-2025/04/26 2)软件形态变革大趋势下,数据库具有不可替代的重要地位:第一,承载数据, 做好数据来源的"源头关"治理。AI 时代,AI 训练的来源是数据,精确、可靠的 高质量数据是做好 AI 训练的关键,数据库则是承载高质量数据的载体。第二, 向量数据库、RAG 等产品和技术直接赋能 AI 发展,缓解大模型推理的"幻觉" 等问题,数据库成为 ...