Workflow
视频稀疏注意力(VSA)
icon
Search documents
一夜颠覆Sora神话,H200单卡5秒出片,全华人团队开源AI引爆视频圈
3 6 Ke· 2025-08-07 07:29
单块H200,5秒即生一个5秒视频。 最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。 论文地址:https://arxiv.org/pdf/2505.13389 它的核心采用了「稀疏蒸馏」全新的训练方案,实现了高效生成,让视频去噪速度实现70倍飙升。 基于FastVideo架构,FastWan2.1-1.3B在单张H200上,去噪时间仅1秒,5秒内生成了480p的5秒视频。 在一张RTX 4090上,则耗时21秒生成一个视频,去噪时间2.8秒。 若仅计算DiT处理时间 升级版FastWan2.2-5B,在单张H200上仅用16秒即可生成720P的5秒视频。 FastWan模型权重、训练方案和数据集全部开源 稀疏蒸馏,AI视频进入极速模式 「稀疏蒸馏」究竟是什么,能够让模型如此快速地生成视频? 一直以来,视频扩散模型成为了AI视频生成领域的主流,比如Sora采用了扩散模型+Transformer架构。 这些模型虽强大,却长期受困于两大瓶颈: 1. 生成视频时,需要海量的去噪步骤 2. 处理长序列时的注意力二次方计算成本,高分辨率视频必然面临此问题。 就以Wan2.1-1 ...