Workflow
阿里开源全能视频模型!生成编辑都精通,1.3B版本消费级显卡可跑
量子位·2025-05-15 06:26

一水 发自 凹非寺 量子位 | 公众号 QbitAI 业界功能最全、消费级显卡可跑、而且还是开源的?! 不卖关子了,这就是阿里最新开源的通义万相 Wan2.1-VACE ,号称当前业界功能最全的 视频生成与编辑模型 。 有多全呢?来看官方介绍海报: 按照万相产品负责人的说法,"所有你能想到的关于视频生成的玩法,几乎都在这里了"。 而且与以往不同,以上功能主打"All in one",都能在一个模型里体验。 目前Wan2.1-VACE一共有两个版本: 模型已在GitHub、Hugging Face和魔搭社区上线,动手能力强的小伙伴现在可自行本地化部署,至于其他想在产品端直接体验的朋友,可能 还要等一两天。 初阶玩法 :基础的文生视频、图生视频(含首尾帧)、视频生视频等; 中阶玩法 :加入编辑功能,局部抹除或替换、视频重绘、时长或背景延展等; 高阶玩法 :将各种能力花式组合。 下面我们依次挑其中的一些亮点来看。 OK,话不多说,我们直接看新模型究竟有哪些玩法。 视频生成领域的"全能选手" 生成的视频如下,不仅还原了文字所描述的氛围感,而且娃娃和小蛇的动作姿态都比较自然,整体构图和谐。 经过一番梳理,Wan2.1- ...