AI长视频生成
Search documents
攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱
3 6 Ke· 2025-12-25 07:54
你是否曾被AI视频生成的不连贯性所困扰? 在交互式创作中,仅仅切换一句提示词,故事就可能瞬间"崩塌":一个角色暂时离开画面后再次出现,却"面目全非",仿佛换了演员;或者,当你尝试引 入一个新角色,AI却在后续的剧情中反复"召唤"这个新人,甚至将多个角色的特征混淆在一起。这种"金鱼记忆"式的顽疾,正是长视频生成在叙事上的一 大致命伤。 现在,来自香港大学和快手可灵(Kling)团队的研究者们,联合推出了突破性方案——MemFlow。 3. "各自为政"的流程:还有一些流程试图将任务拆分,先让一个模型制作关键帧脚本,再让另一个模型根据脚本生成视频。这种方式在根据各段脚本分别 生成时是各自独立的,拼接成的完整视频缺乏全局一致性。 这些僵化的、非自适应的记忆策略,无法应对交互式创作中流动的、不可预测的叙事需求,这正是导致交互式长视频生成一致性差的原因。 产生真正的长时记忆与叙事连贯性 这是一种创新的流式自适应记忆机制,它赋予了AI强大的长时记忆与叙事连贯性,有望彻底解决上述难题。 流动的叙事 vs. 僵化的记忆 为了生成长视频,主流模型普遍采用"分块生成"的策略,即像放映幻灯片一样,一段一段地生成视频片段。 然而,如 ...
百度蒸汽机发布通用AI长视频生成功能
Zheng Quan Shi Bao Wang· 2025-09-25 10:26
Core Viewpoint - The article highlights the launch of Baidu's upgraded "Steam Engine," which introduces a groundbreaking AI long video generation feature, allowing users to create videos of unlimited length using streaming technology, marking a significant advancement in the industry [1] Group 1: Product Development - Baidu has upgraded its "Steam Engine" to support the generation of AI videos of unlimited length, a first in the industry [1] - The new feature offers a "streaming infinite generation" experience, overcoming previous limitations of AI video generation that were restricted to short clips of 5 to 10 seconds [1] - The upgrade utilizes streaming generation technology, enabling continuous video creation without the need for frame control [1]
突破长视频生成瓶颈:南大、TeleAI推出全新AI生成范式MMPL,让创意一镜到底
机器之心· 2025-08-25 06:08
向迅之,南京大学 R&L 课题组在读博士生,导师是范琦副教授。研究聚焦图像/视频生成与世界模型等 AIGC 方向。 你是否曾被 AI 生成视频的惊艳开场所吸引,却在几秒后失望于⾊彩漂移、画面模糊、节奏断裂? 当前 AI 长视频⽣成普遍⾯临 "高开低走 " 的困境:前 几 秒惊艳 夺⽬ ,之后却质量骤降、细节崩坏;更别提帧间串行生成导致的低效问题 —— 动辄数小时的等待,实时预览几乎难以企及。 这—行业难题,如今迎来突破性解法! 南京大学联合 TeleAI 推出长视频自回归生成新范式——Macro-from-Micro Planning( MMPL),重新定义 AI 视频创作流程。 灵感源自电影工业的 "分镜脚本 + 多组并行拍摄" 机制,MMPL 首创 "宏观规划、微观执行 " 的双层⽣成架构: 成果令人振奋: MMPL 不仅是—项技术升级,更是向 "AI 导演" 迈进的重要—步 —— 让机器不仅会 "拍镜头" ,更能 "讲好—个故事"。 先谋全局:在宏观层面统—规划整段视频的叙事脉络与视觉—致性,确保剧情连贯、风格统—; 再精细节:将长视频拆解为多个短片段,并通过并行化⽣成管线⾼效填充每—帧细节,大幅提升速 ...