AAAI 2026 Oral|快手提出全新「检索数据引擎」CroPS,打破搜索信息茧房
短视频搜索业务是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房, 难以召回潜在相关的新鲜内容。 针对这一问题, 快手搜索团队提出了一套全新的检索数据引擎 CroPS(Cross-Perspective Positive Samples)。 该方法通过引入用户换 Query 数据、推荐流数据以 及大模型生成的世界知识,多视角丰富了正样本信号,并结合层次化标签分配(HLA)策略和 H-InfoNCE 损失函数,实现了对相关性的精细化建模。 目前,CroPS 已在快手搜索业务中实现全量部署,服务亿级用户。实测表明, 该方案在具备极强的架构普适性的同时,显著提升了 CTR 与长播率,并有效降低用 户换 Query 率,优化用户搜索体验。 本工作相关成果《CroPS: Improving Dense Retrieval with Cross-Perspective Positive Samples in Short-Video Search》已被人工智能顶级会议 AAAI 2026 Oral 接收。 然而,在绝大多数工业系统中, 训练数据的正样 ...