AI视频生成

Search documents
AI视频生成的Vidu样本:攻坚视频生成核心难题,引领内容生产力变革
锦秋集· 2025-05-06 14:36
多模态 AI 技术正以前所未有的速度重塑内容创作领域。 从2024年 OpenAI Sora 点燃全球想象,到近期,吉卜力风图片席卷全网。这个一度被视为 AI 终极想象力边界 的领域,正以前所未有的速度冲破技术壁垒。 视频生成作为技术难度与应用潜力并存的关键环节,也吸引了全球范围内的广泛关注和投入。 在追求更长时长、更高分辨率、更惊艳视觉效果的同时,内容一致性难以保证、生成过程可控性不足、以及高 昂的计算成本等核心挑战,依然限制了其在专业领域、大众娱乐领域的规模化应用。 在此背景下,由生数科技研发的视频生成模型 Vidu,展现出一条差异化的发展路径。在多模态视频生成技术 的早期发展阶段,通过集中资源解决专业用户的核心痛点,如一致性、可控性、效率,建立起差异化优势和用 户基础,尤其是在动画等特定领域形成壁垒。 根据生数科技廖谦在近期访谈中的阐述,Vidu 的核心定位是"全球领先的AI内容生产平台 ",这也意味着 ,除 了追求基础生成能力的提升,也需要优先解决实际工作流中的关键痛点。 比如,生数科技敏锐的发现,纯粹的文生视频因为难以控制一致性,应用者并不多 。而 Vidu 推出的"参考 生"(Reference ...
ZPedia丨诺兰看了沉默,王家卫看了流泪:全球首款无限时长AI视频模型横空出世
Z Finance· 2025-04-21 01:56
Core Viewpoint - The article discusses the current state of AI video generation, highlighting the limitations of existing tools and the breakthrough achieved by Kunlun Wanwei's Skyreels-V2, which redefines video generation capabilities and offers a comprehensive filmmaking solution [1][3]. Group 1: Current State of AI Video Generation - AI video generation tools are currently limited to short clips of around 10 seconds, struggling with coherent storytelling and quality [1]. - Existing models often produce unsatisfactory visual effects and lack emotional depth in character portrayal [1][3]. - The industry is facing a technical bottleneck, with many tools unable to produce longer, cohesive narratives [1][5]. Group 2: Breakthrough of Skyreels-V2 - Skyreels-V2 is the first open-source film-grade generation model that supports unlimited video length, breaking the existing constraints of AI video generation [1][3]. - It introduces a "dual-engine" architecture that enhances three core metrics: duration extensibility, visual quality, and director control [1][3]. - The model allows for continuous storytelling, enabling the creation of long-form content that rivals traditional filmmaking [6][10]. Group 3: Technical Innovations - Skyreels-V2 employs a diffusion forced framework, integrating multi-modal large language models and reinforcement learning to overcome existing technical challenges [10][12]. - The model has a vast dataset of over 100 million samples, including 280,000 films and series, which enhances its training and output quality [14]. - It achieves high visual fidelity, supporting outputs of 720p and above, and maintains realistic motion dynamics [8][12]. Group 4: Practical Applications - Skyreels-V2 serves as a creative platform for various users, from novelists to marketers, enabling them to generate high-quality video content with minimal technical knowledge [20][22]. - It allows creators to experiment with different narrative styles and visual languages, enhancing the creative process [24][25]. - The model simplifies the filmmaking process, making it accessible to a broader audience by transforming ideas into visual narratives without the need for extensive technical skills [25].
速递|AI视频Runway发布Gen-4,低成本生成720p微电影,影视业是否会买账?
Z Potentials· 2025-04-01 03:49
图片来源: Runway Runway AI 的一款新人工智能模型旨在让用户创建具有一致角色、物体和背景的视频, 这标志着在利用计算机更快速、低成本制作电影的竞赛中可能取得 了重大进展。 Runway 计划在周一向付费用户发布 Gen-4 ,并计划在本周晚些时候添加一个功能,旨在使软件在生成视频场景时更加一致。 公司表示,用户将能够生成 720p 分辨率的五秒和十秒长的剪辑。 本次 Runway 的新 AI 模型 挑战 OpenAI 的 Sora ,将为用户提供更连贯的视频。 这家总部位于纽约的初创公司在 2023 年初推出了一种模型,能够根据书面提示生成略显卡顿的三秒剪辑,从而引发了对 AI 视频生成器的热潮,例如"沙漠 景观的无人机镜头"。两年后,竞争显著加剧,包括 OpenAI 和 Pika 在内的科技公司纷纷推出类似服务。现在, Runway 正努力保持在竞争的前列。 " "我们现在的目标是,确保我们正在开发和构建的东西,达到好莱坞和实际电影制作人及专业人士所要求的标准和质量。" Runway 的联合创始人兼CEO Cris Valenzuela(克里斯·瓦伦苏埃拉)在一次采访中说道。"这感觉像是一个 ...
生数科技加速商业化:原字节跳动AI大将、火山引擎高管骆怡航加盟出任CEO
IPO早知道· 2025-03-13 05:06
AI视频生成赛道已到了技术成熟和商业化落地的关键时刻。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职, 全面负责公司研发、产品、商业化及团队管理工作。 图 生数 骆怡航博士毕业于清华大学自动化系,深耕云计算及AI领域十余年,拥有深厚的技术背景、产业生态 理解和成熟的商业化经验,还具有丰富的海外拓展经历。 在加入生数科技之前,他担任字节跳动火 山引擎AI应用产品线一号位,汇报火山引擎总裁,全权负责产品线的战略、产品和商业化。 据悉, 该条产品线由骆怡航博士从 0组建,涵盖多个传统AI、大模型及大模型应用产品,管理规模数百人, 服务全球多个行业及国家的近万家客户,该产品线当前是火山引擎的重点产品线之一,也是大模型业 务的主力产品线。更早期,他在字节跳动负责AI解决方案与商业合作,曾参与到字节跳动早期的AI中 台规划与建设,见证并推动了字节跳动在AI领域的发展。 事实上,从整个行业发展来说,骆怡航选择加入生数科技,某种程度上也意味着AI视频生成赛道已到 了技术成熟和商业化落地的关键 ...
速递|OpenAI 计划将Sora接入ChatGPT,Sora的生成能力或扩展到图像
Z Potentials· 2025-03-01 03:53
Core Viewpoint - OpenAI plans to integrate its AI video generation tool Sora into ChatGPT, aiming to expand the tool's accessibility and functionality while maintaining the simplicity of ChatGPT [2][3][4]. Group 1: Sora Integration and Expansion - OpenAI intends to make Sora accessible within ChatGPT, although the version may not offer the same level of control as the standalone web application [3]. - The integration of Sora into ChatGPT could drive user engagement and potentially encourage upgrades to premium subscriptions for more frequent video generation [3][4]. - OpenAI is actively seeking mobile engineers to develop a standalone Sora mobile application, enhancing user experience and accessibility [4]. Group 2: Future Developments - OpenAI is working on expanding Sora's capabilities to include image generation, potentially allowing users to create more realistic photos [5]. - The company is also developing a new version called Sora Turbo, which powers the current Sora web application [6].
对话 PixVerse 王长虎:AI 视频生成可能通向新平台,Sora 只领先几个月
晚点LatePost· 2024-04-30 10:25
"抖音就是从 15 秒的视频做起来的。" 文丨王与桐 编辑丨程曼褀 今年 2 月 OpenAI 发布了由视频模型 Sora 生成的视频,时长可达 60 秒并且视频内容丝滑、连贯、 逼真。 一张梗图在 Sora 发布后流传于社交媒体:Sora 是坐在宝座上的巨大神像,下面跪着一众渺小的膜拜 者,包括 Runway、Pika、SVD、PixVerse 等十多个视频生成模型或产品。 Sora 出现后,这张梗图开始流传。 "能被放在第一排,我们很高兴。" 推出 PixVerse 的爱诗科技创始人兼 CEO 王长虎说。 PixVerse 是 "膜拜者" 中唯一一个由中国公司开发的产品,网页端产品在今年 1 月上线,根据第三方 监测平台 SimilarWeb 数据,PixVerse 3 个月内达到了超过 140 万的月访问量,去年 11 月上线的 Pika 现在是超 200 万的月访问量。 做出 PixVerse 的爱诗科技由王长虎在 2023 年 4 月创立。2017 年初 ,王长虎加入字节跳动,担任 AI Lab 视觉技术负责人。作为在微软亚洲研究院学习和工作十余年的计算机视觉专家,王长虎带领 技术团队,研发了抖音、 ...