Workflow
500万视频数据集+全新评测框架!北大开源主体一致性视频生成领域新基建OpenS2V-Nexus,生成视频 「像」 又 「自然」
机器之心·2025-07-08 09:41

然而,要训练和评价这样的模型,过去一直缺少公开可用的 大规模数据集和细粒度评测基准 ,限制了 S2V 技术的快速突破。 想让 AI 能 「看着你的自拍就生成一致且自然的短视频 」 吗?这就是 Subject-to-Video(S2V)生成 要解决 的问题:让视频生成不仅对齐文本,还能准确保留指定人物或物体的特征,让生成的视频既 「像 」 又 「自然 」 。这一能力对于短视频生成、虚拟人、AI 剪辑等都有巨大意义。 为此, 北大团队推出了全新的开源套件 OpenS2V-Nexus ,专为 S2V 生成打造: OpenS2V-Eval: 全球首个面向主体一致性、自然度和文本对齐的 S2V 细粒度评测基准,让不同模型在 主体一致性上真正可比。 OpenS2V-5M: 全球首个公开的 500 万条高质量 720P 人物文本视频三元组数据集 ,覆盖真实和合成数 据,帮助研究者快速训练更强大的生成模型。 北大团队还在 18 个代表性 S2V 模型上进行了系统评测,首次揭示了目前主流模型在保持主体一致性和自然 度方面的真实能力差距。 通过 OpenS2V-Nexus,未来做 AI 视频生成不再盲人摸象,让训练更高效、评测更 ...