RankMixer模型

Search documents
抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨
量子位· 2025-08-01 09:05
字节跳动团队 投稿 量子位 | 公众号 QbitAI 你刷的每一条短视频,背后都隐藏着推荐算法的迭代与革新。 作为最新成果,字节跳动的算法团队提出的全新推荐排序模型架构 RankMixer ,在兼顾算力利用率的同时,实现了模型效果的可扩展性。 RankMixer以软硬件协同的视角重新设计推荐模型,"马车换跑车",将抖音推荐精排模型的Dense参数量从一千万量级(16M)扩大两个数量 级到了 10亿(1B)量级 。 同时通过充分发挥GPU的算力和极致的工程优化,研究团队将模型的MFU提升近10倍到40%+,推理SM Activity从30%提升到80%,大幅降 低Scaling Up推理成本,在参数量变大两个数量级下 推理成本不增加 。 在抖音主feed推荐场景,RankMixer-1B模型在不增加延迟下已经全量生效,累计 带来了超过0.3%的LT30收益和超过1%的用户时长收益 , 并且推广到字节内部几十个业务场景完成上线。 RankMixer模型结构 抖音每天为数亿用户提供个性化信息流服务。而支撑这一切的,正是其幕后强大的推荐算法模型。 近年来随着推荐领域海量内容和数据量爆炸式增长、大语言模型算法的变革、以 ...