Workflow
超高清视频数据集
icon
Search documents
1080p飞升4k,浙大开源原生超高清视频生成方案,突破AI视频生成清晰度上限
量子位· 2025-07-01 03:51
为什么AI生成的视频总是模糊卡顿?为什么细节纹理经不起放大?为什么动作描述总与画面错位? 其中一个重要原因在于,现有的开源千万级视频数据集分辨率基本低于1080P(1920×1080),且大部分视频的说明(caption)简单粗糙, 不利于大模型学习。 当主流视频生成模型还在720P画质挣扎时,浙江大学APRIL实验室联合多家高校推出的 高质量开源UHD-4K(其中22.4%为8K)文本到视频 数据集——UltraVideo ,破解了这一困局。 浙大APRIL实验室团队 投稿 量子位 | 公众号 QbitAI 该数据集涵盖广泛主题(超过100种),每个视频配备9个结构化字幕及一个总结性字幕(平均824词)。 作为全球首个开源4K/8K超高清视频数据集, UltraVideo 配合结构化语义描述框架,让视频生成实现从"勉强能看"到"影院级质感"的跨越式 进化。 团队基于42K精选视频微调的UltraWan-4K模型,实现三大突破: 方法:四阶过滤打造高质量4K视频数据集 当前视频生成面临两大瓶颈: 分辨率陷阱 :模型在低清数据训练后,直接生成4K视频会出现严重失真。如图2所示,naïve Wan-T2V-1.3 ...