AutoMV
Search documents
告别“音画割裂”与“人物崩坏”!AutoMV:首个听懂歌词、卡准节拍的开源全曲级MV生成Agent
量子位· 2025-12-29 06:37
现有的AI视频生成模型虽然在短片上效果惊人,但面对一首完整的歌曲时往往束手无策——画面不连贯、人物换脸、甚至完全不理会歌词含 义。 近日,来自M-A-P、北京邮电大学、南京大学NJU-LINK实验室等机构的研究者们提出了 AutoMV 。 这是一个 无需训练的多智能体(Multi-Agent)系统 ,它像一个专业的摄制组,能根据音乐节拍、歌词和结构,自动生成长达数分钟、叙事 连贯且音画同步的完整MV。 AutoMV团队 投稿 量子位 | 公众号 QbitAI 对于独立音乐人来说,制作一支专业的MV往往意味着高昂的成本 (约1万美元) 和漫长的周期 (数十小时) 。 虽然Sora、Runway等视频生成模型层出不穷,但直接用它们生成MV面临三大挑战: 1.时长限制 :大多数模型只能生成几秒钟的片段,无法覆盖整首歌。 2.音画割裂 :生成的画面往往只跟提示词有关,忽略了音乐的节拍 (Beats) 、结构 (Intro/Chorus) 和歌词含义。 △ 《Lazy Song Demo》 △ 《Beliver Demo》 为什么做"全曲"MV这么难? △ 《APT Demo》 3.一致性差 :在长达几分钟的视频中,主 ...