Workflow
6秒造一个「视频博主」,Pika让一切图片开口说话
机器之心·2025-08-13 03:27

还记得 veo3 发布时引起的轰动吗?「音画同步」功能的革命性直接把其他视频生成模型按在地上摩擦,拍 摄 + 配音 + 粗剪一键搞定。 那如果我就是想用自己迷人的声音呢?或者我自带精妙绝伦的配音?有没有其他解决方案? 机器之心报道 编辑:+0 制作一个视频需要几步?可以简单概括为:拍摄 + 配音 + 剪辑。 有的朋友,有的! Pika 允许用户上传音频文件(如语音、音乐、说唱或任何声音片段),并结合静态图像(如自拍或任意图 片)生成高度同步的视频。视频中的角色会自动匹配音频,实现精确的口型同步(lip sync)、自然的表情 变化和流畅的身体动作。 更通俗一点说就是, 让任何一张静态图片,跟着你给的音频动起来 ,而且是活灵活现的那种。 你随便扔给它一张自拍,再配上一段马保国的「年轻人不讲武德」,你照片里那张帅气的脸,马上就能口 型神同步,连眉毛挑动的时机都分毫不差,主打一个「本人亲授」。 这事儿要是放以前,你起码得是个顶级特效师,捣鼓个十天半个月才能弄出来。现在,Pika 告诉你, 平均 只要 6 秒 。 8 月 11 日,Pika 推出了一个名为「 音频驱动表演模型 」(Audio-Driven Perfo ...