Workflow
数据减少超千倍,500 美金就可训练一流视频模型,港城、华为Pusa来了
机器之心·2025-06-19 02:28

FVDM & Pusa 一作:刘耀芳目前在香港城市大学攻读博士学位,导师为著名数学家 Prof. Raymond Chan (陈汉夫) 及 Prof. MOREL Jean-Michel。他 也曾在腾讯 AI Lab 实习,主导 / 参与 EvalCrafter , VideoCrafter 等工作,其研究兴趣包括扩散模型,视频生成等;项目主管:刘睿,香港中文大学 MMLab 博士,华为香港研究所小艺团队技术负责人。 论文标题:Redefining Temporal Modeling in Video Diffusion: The Vectorized Timestep Approach FVDM 论文:https://arxiv.org/abs/2410.03160 Pusa 主页 / 代码库: https://github.com/Yaofang-Liu/Pusa-VidGen 具体而言,Pusa 通过对预训练模型如 Wan-T2V 14B 进行 非破坏性微调,仅需 500 美金训练成本即可达到比 Wan 官方 I2V(至少 O(100k) 美金的训练 成本)更好的效果,成本降低超 200 倍,数据更是减 ...