Cling 2.1%

Search documents
The Ultimate AI Video Stack: Up-to-Date Best Tools to Make Content With AI
a16z· 2025-06-11 13:00
AI 视频工具概览 - A16Z 的 Justine 分享了她用于创作 AI 视频的工具栈,主要面向消费者创作者 [1][2][3] - 强调了在众多 AI 模型中选择合适工具的重要性,不同的模型有不同的优势 [2][3] 文本生成视频 - V3 被认为是目前最佳的文本生成视频模型,可通过 Google Labs 中的 Flow 工具访问 (labs.google/fx/tools/flow) [3][4] - 使用 V3 需要 Google Ultra AI 订阅 [4] - V3 的文本生成视频功能支持原生生成音频,而帧到视频和成分到视频功能则不支持 [4][5] - 建议每次提示生成两个输出,并确保模型设置为 V3 以避免被切换到 V2 [5][6] - 建议使用简洁的提示,并通过迭代来优化结果 [7] - 如果文本内容不足以填充 8 秒的音频,模型可能会生成奇怪的填充词 [9] 图像生成视频 - Cling 2.1% 是从图像生成视频的首选模型,用于动画化图像,使人物或背景移动 [13] - Cling 2.1% 目前仅支持起始帧,但未来可能会增加更多帧 [14] - 用户可以上传图像或从历史记录中选择,并使用灵感和预设来控制相机移动 [14][15] 角色口型同步 - Hedra 是使角色说话的首选工具,需要起始帧(角色图像)、音频脚本和文本提示 [18][19] - Hedra 允许用户生成语音、录制音频或上传音频,并支持克隆用户自己的声音 [20][21] 视觉特效 - Higsfield 是一个视觉特效平台,用户可以浏览和运行其他用户创建的效果 [27] 开放源代码模型测试 - Korea 是一个多模态生成和编辑平台,允许用户在不同的模型上运行相同的提示和起始图像 [30][32] - Korea 提供了多种模型,并允许用户使用 Topaz 或 Korea 自己的模型来增强 AI 输出 [34]