Workflow
推荐系统
icon
Search documents
ICML spotlight | 一种会「进化」的合成数据!无需上传隐私,也能生成高质量垂域数据
机器之心· 2025-07-11 09:22
张剑清是一名上海交通大学在读博士生,获中国人工智能学会「青托 」 、吴文俊人工智能荣誉博士及国家奖学金。在代码大模型、 合成数据集进化生成、联邦学习与推荐系统方向取得系列成果,主要关注其中的垂域自适应、模型融合、模型个性化主题,于 JMLR、NeurIPS、ICML、CVPR、KDD、ICCV、AAAI等发表9篇CCF-A一作论文,主导并开源了PFLlib、HtFLlib、EvolveGen 等项目,曾在字节跳动、清华AIR、KAUST、腾讯等机构实习交流。 数据短缺问题随着大模型的高速发展,日益加剧。已经有不少 Nature 论文指出,预计到 2028 年,公共数据的产生速度将因 赶不上大模型训练的消耗速度而被耗尽。而在某些特殊领域,比如医疗、工业制造等,原本可用数据就非常少,数据短缺的问 题更严重。 为了解决这一困境,我们提出了合成数据自主进化框架 PCEvolve:只需提供少量标注样本,就可在保护隐私同时进化出一整 个数据集。PCEvolve 的进化过程类似 DeepMind 提出的 FunSearch 和 AlphaEvolve。 现有大模型 API 并不能拿来直接合成垂域数据 然而,当应用到垂直领域 ...
【快手-W(1024.HK)】泛货架商业化&推荐系统OneRec推动,25H2广告增长有望加速——跟踪研究报告(付天姿/赵越)
光大证券研究· 2025-07-01 13:47
点击注册小程序 查看完整报告 特别申明: 本订阅号中所涉及的证券研究信息由光大证券研究所编写,仅面向光大证券专业投资者客户,用作新媒体形势下研究 信息和研究观点的沟通交流。非光大证券专业投资者客户,请勿订阅、接收或使用本订阅号中的任何信息。本订阅号 难以设置访问权限,若给您造成不便,敬请谅解。光大证券研究所不会因关注、收到或阅读本订阅号推送内容而视相 关人员为光大证券的客户。 点评: 快手618期间泛货架增长较快,为广告商业化提供流量基础 1)电商整体GMV符合预期,泛货架增速快于大盘。根据快手披露,618期间商品卡GMV同比增长超53%,搜 索GMV同比增长超143%,挂车短视频GMV同比增长超29%。泛货架作为区别于直播间的内容消费场域,已逐 步成为用户浏览、发现与购买的重要通路,内容消费与商品转化之间的路径更加清晰。2)泛货架具备进一步 广告商业化潜力,有望在25H2带来新增量。快手早期重点在于通过流量分发、供应链扶持及智能化工具建 设,引导生态内商家提升投放效率。随着中小商家逐步成熟,平台有望推动部分流量位产品化,并通过智能化 工具引导商家开展自主投放,逐步建立面向泛货架场景的广告转化链路。 全新端到 ...
特想聊聊快手这次的变化
Hu Xiu· 2025-06-25 00:48
前几日刷朋友圈,看到消息说快手已经把 AI 大模型驱动的推荐系统全量上线到产品中。而这套基于大模型的生成式推荐系统,是行业里第一个工业级的 推荐解决方案。放眼全球,目前还没有其他大公司能做到这个程度。 快手的技术这几年确实有点东西。比如他们的视频生成模型可灵,现在也是全球顶级水准。 以前我更多把快手当成一家短视频公司,现在回头看,他们在底层技术上的积累,其实比我想象中要深得多。这也让我越来越好奇这家公司的运作方式。 我总觉得,公司的创新背后,其实是它气质和风格的延伸。 说回到推荐系统。其实我们对推荐系统并不陌生,它当属移动互联网时代最大的技术创新之一。包括快手、抖音、拼多多、美团、小红书等耳熟能详的国 民级产品,他们的模式均建立在推荐系统之上。推荐系统的本质是完成人和信息的匹配,目前来看,大致有两种信息分发方式: 一类是基于用户的协同过滤,推荐系统根据用户的自然属性(年龄、性别、学历等信息)和浏览兴趣来计算用户相似度,进而给相似用户推荐内容。另一 类是基于内容的协同过滤。推荐系统提取内容的特征,然后计算不同内容之间的相似性之后,给用户推荐与过去喜欢内容相似的内容。 当然还有一类是给用户直接推荐系统的高热内容, ...
打破推荐系统「信息孤岛」!中科大与华为提出首个生成式多阶段统一框架,性能全面超越 SOTA
机器之心· 2025-06-20 10:37
论文作者来自 认知智能全国重点实验室陈恩红团队,华为诺亚方舟实验室 在信息爆炸的时代,推荐系统已成为我们获取资讯、商品和服务的核心入口。无论是电商平台的 "猜你喜欢",还是内容应用的信息流,背后都离不开推荐算法的 默默耕耘。然而,传统的推荐系统普遍采用多阶段范式(如召回、排序),这种设计虽然在工程上实现了效率,却常常面临阶段间信息损失、性能瓶颈等问题。 近年来,生成式人工智能的浪潮席卷全球,其强大的序列建模和内容生成能力为解决推荐系统的固有难题带来了新的曙光。如果能将推荐过程中的多个阶段融为 一体,是否就能克服信息损失,实现更高效、更精准的推荐呢? 来自中国科学技术大学和华为诺亚方舟实验室的研究者们,在即将于 SIGIR 2025 会议上进行口头报告(Oral Presentation)的论文 Killing Two Birds with One Stone: Unifying Retrieval and Ranking with a Single Generative Recommendation Model 中,给出了一份创新的答案。他们提出了一个名为 UniGRF 的统一生成式推荐框架, 巧妙地实现了 ...
推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本
机器之心· 2025-06-19 09:30
机器之心报道 机器之心编辑部 人人都绕不开的推荐系统,如今正被注入新的 AI 动能。 随着 AI 领域掀起一场由大型语言模型(LLM)引领的生成式革命,它们凭借着强大的端到端学习能力、海量数据理解能力以及前所未有的内容生成潜力,开始重 塑各领域的传统技术栈。 作为互联网流量的核心引擎,推荐系统面临着级联架构导致的算力碎片化、优化目标割裂等问题,并逐渐制约其创新发展。实现从碎片化拼装到一体化整合的范 式跃迁,是推荐系统重焕生机的必由之路,而利用 LLM 技术重构架构以实现效果提升、成本降低成为关键。 近日,快手技术团队交出了他们的答卷,最新提出的「OneRec」首次以端到端生成式架构重构推荐系统全链路。 在效果与成本这场看似零和的博弈中,OneRec 让「既要又要」成为可能 : 目前,该系统已在快手 App / 快手极速版双端服务所有用户,承接约 25% 的QPS( 每秒请求数量 ) ,带动 App 停留时长提升 0.54%/1.24%,关键指标 7 日用户生 命周期(LT7)显著增长,为推荐系统从传统 Pipeline 迈向端到端生成式架构提供了首个工业级可行方案。 下图(左)展示了快手 / 快手极速版中 O ...
特征工程、模型结构、AIGC——大模型在推荐系统中的3大落地方向|文末赠书
AI前线· 2025-05-10 05:48
这里是「王喆的机器学习笔记」的第四十五篇文章。今天我们谈谈一个搜广推行业这两年怎么都绕不开的一个话题,大模型在推荐系统中的应用。两年 前,我们可以说大模型是推荐系统的未来,但如今,大模型对推荐系统的改造已经如火如荼的发生着,很多头部公司都拿到了显著的收益。这篇文章不 谈未来,不谈学术,就谈业界已经发生的切切实实拿到收益的大模型应用方向。 大模型影响推荐系统的三个层次 谈具体的应用之前,我们先从宏观上理解一下大模型的出现对推荐系统到底意味着什么。 三、大模型开始创造一个"新世界" OpenAI 在发布 Sora 之时,喊出了"Sora 是这个世界的模拟器"的口号。大模型最大的野心其实是完全创造一个新的虚拟世界。回到推荐系统领域,其实 推荐系统一直以来的使命是帮助人发掘感兴趣的信息和内容。但大模型极强的内容生成能力,让"个性化内容生成"成为可能。也就是说,大模型有可能 越过"推荐"这个环节,直接为用户创造个性化内容,这才是大模型可能带给推荐系统最大的革命。 从宏观上厘清了大模型革命的三个层次,我们才能脚踏实地的探索那些可能落地的应用。下面列出一些经过我筛选的,并且也有一些落地经验的大模型 推荐系统应用方向。 理解 ...
在“推荐就是一切”的时代
Hu Xiu· 2025-05-08 09:54
"决定你命运的不是机遇,而是选择",这句格言常被归于琴·尼德奇(Jean Nidetch),堪称亚里士多德 伦理学的一种总结(网上有大量的误传,真的相信其为亚里士多德的金句)。尼德奇1963年创立综合性 减肥方案和饮食计划Weight Watchers,旨在帮助人们通过健康的饮食和生活方式的改变来减轻体重。她 是今天我们所熟悉的网上"健康达人"的真正鼻祖,一位来自皇后区的家庭主妇在减肥过程中,凭借雄心 壮志,找到了一个出口、一种身份和一条自我实现的路径。 选择多么重要,如果是自我作出的。但在人工智能时代,选择还属于我们的吗? 推荐引擎革命 这是一个生活处处被推荐系统影响的时代。Spotify的"每周发现"功能向全球音乐爱好者承诺,提供他们 从未听过但一定会喜欢的个性化歌曲播放列表。Netflix的算法不仅使"刷剧"成为可能,而且可以预测用 户的观看喜好。Google地图则为用户提供最快、最安全的出行路线建议。 "一切皆为推荐"(Everything is a recommendation)是Netflix常喊的一句口号,意谓该平台上哪怕是看似 简单的内容列表,也会根据用户的观看历史精心策划和加以个性化,其本质 ...