视频生成

Search documents
ZPedia丨诺兰看了沉默,王家卫看了流泪:全球首款无限时长AI视频模型横空出世
Z Finance· 2025-04-21 01:56
AI拍片现状——导演看了想转行 2025年,AI视频生成工具仍然活跃在"短平快"的战场上打转。几乎所有产品都卡在一个尴尬的瓶颈: 单 视频时长还停留在10秒左右,剧情刚刚起个头,模 型已经开始喘气, 创作者们不得不通过"拼接手法"让作品续命 ;运镜效果不堪入目,像是菜刀绑在GoPro上拍的风景片;输入"悲伤逆光奔跑",AI却端出 一个毫无情绪的面瘫角色,还附赠一束奇怪的炫光特效。 当前阶段的AI视频生成技术,或许已经实现了"能生成画面"的突破,但距离"会讲故事"的境界还相去甚远。即便是一个简单的连贯动作,也需要开发者反复 调试参数;面对那些似是而非的生成结果,创作者们往往在一声"勉强能用"的叹息后,默默关闭了程序界面。 就在行业陷入技术瓶颈的胶着时刻,昆仑万维以双剑出鞘之势打破僵局:其推出的Skyreels-V2不仅成为全球首个支持无限时长的开源电影级生成模型,更 携手多主体视频生成模型Skyreels-A2,以"双引擎"架构重新定义了视频生成领域的三大核心指标——时长延展性、画面品质感、导演控制力。 Github 地址: https://github.com/SkyworkAI/SkyReels-V2 产品 ...
阶跃星辰 Tech Fellow 段楠:Step-Video 系列模型的关键技术解读
AI科技大本营· 2025-03-21 06:35
4 月 18-19 日,由 CSDN&Boolan 联合举办的「2025 全球机器学习技术大会」将在上海虹桥西郊庄园丽笙大酒店隆重举行,本次大会共设 12 大技术 专题,云集院士、IEEE Fellow、顶尖学者、一线科技企业技术实战专家组成的超 50 位重磅嘉宾。他们将以独特的视角,解读智能体、联邦学习、多 模态大模型、强化学习等前沿议题。 在 4 月 18 日下午,走在多模态研究前沿的阶跃星辰 Tech Fellow,多模态基础模型领域专家段楠博士将在「多模态大模型前沿」专场带来《视频生成 基础模型进展、挑战和未来》的主题分享,分享其在视频生成基础模型方面的最新研究成果和前瞻性思考。 段楠博士拥有深厚的学术背景和丰富的产业经验。他长期深耕自然语言处理、代码智能、多模态基础模型和智能体等领域,是中国科学技术大学和西安 交通大学兼职博导,天津大学兼职教授。在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十 二年,对自然语言处理和多模态技术的发展做出了卓越贡献。 在 2025 全球机器学习技术大会上,段楠博士将围绕阶跃星辰开源的 Step-Video 系列模型,深入 ...
生数科技加速商业化:原字节跳动AI大将、火山引擎高管骆怡航加盟出任CEO
IPO早知道· 2025-03-13 05:06
AI视频生成赛道已到了技术成熟和商业化落地的关键时刻。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职, 全面负责公司研发、产品、商业化及团队管理工作。 图 生数 骆怡航博士毕业于清华大学自动化系,深耕云计算及AI领域十余年,拥有深厚的技术背景、产业生态 理解和成熟的商业化经验,还具有丰富的海外拓展经历。 在加入生数科技之前,他担任字节跳动火 山引擎AI应用产品线一号位,汇报火山引擎总裁,全权负责产品线的战略、产品和商业化。 据悉, 该条产品线由骆怡航博士从 0组建,涵盖多个传统AI、大模型及大模型应用产品,管理规模数百人, 服务全球多个行业及国家的近万家客户,该产品线当前是火山引擎的重点产品线之一,也是大模型业 务的主力产品线。更早期,他在字节跳动负责AI解决方案与商业合作,曾参与到字节跳动早期的AI中 台规划与建设,见证并推动了字节跳动在AI领域的发展。 事实上,从整个行业发展来说,骆怡航选择加入生数科技,某种程度上也意味着AI视频生成赛道已到 了技术成熟和商业化落地的关键 ...
速递|OpenAI 计划将Sora接入ChatGPT,Sora的生成能力或扩展到图像
Z Potentials· 2025-03-01 03:53
萨海说, OpenAI 正积极努力让 Sora 可以在 ChatGPT 中访问,将这两个产品结合起来 , 尽管没有透露时间。 萨海表示 , 最终进入 ChatGPT 的 Sora 版本,可能无法提供与 Sora 网络应用程序相同的控制程度, 后者允许用户编辑和拼接视频片段。 利用 Sora 视频将用户引流到 ChatGPT, 将 Sora 接 入 ChatGPT 也可能激励用户升级到 ChatGPT 的高级订阅, 这可能提供更高频率的视频生成。 正如 萨海 在办公时间解释的那样, OpenAI 推出 Sora 作为独立的 Web 应用程序的原因之一是为了维持 ChatGPT 的简单性。 图片来源: Unsplash OpenAI 打算将其 AI 视频生成工具 Sora 直接集成到其应用 ChatGPT 中, 公司在 Discord 上的周五会议上提到。 Sora 仅通过 OpenAI 在 12 月推出的专用 Web 应用程序提供 , 该应用程序允许用户访问同名的 AI 视频模型 , 以生成长达 20 秒的电影风格片段。 然而 ,OpenAI 的 Sora 产品负责人 Rohan Sahai 表示 , 该公司计 ...
阿里开源版Sora上线即屠榜,4070就能跑,免费商用
量子位· 2025-02-26 03:51
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 开源模型,还是得看杭州。 前脚发完QwQ-Max,阿里就在深夜开源了视频生成模型 Wan 2.1 ,14B参数直接 屠榜VBench ,什么Sora、Gen-3通通不是它的对手。 从官方Demo中看,复杂运动细节非常到位, 5个人一起跳hip-hop也能做到动作同步 。 而且在静态图像生成中都还是老大难问题的 文字 ,现在也被万相给攻克了。 当然了,14B的参数量说大不大,但在个人消费级显卡上本地部署还是比较吃力的。 不过14B (支持分辨率720P) 之外,还有一个1.3B的小号版本 (支持分辨率480P) ,在一块 4090上占用显存是8个多GB ,消耗时间4 分21秒。 如此观之,用12GB的 4070,也是能带动的 。 | | | | Computational Efficiency of Wan2.1 | | | | | --- | --- | --- | --- | --- | --- | --- | | | | | (time(s)/ peak memory(G)) | | | | | GPU | Model | Resolution | ...
爱诗科技完成近3亿元A+轮融资,核心AI视频生成产品PixVerse全球用户数超1200万
IPO早知道· 2024-12-18 03:14
持续推动AI视频生成技术普惠。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,爱诗科技日前完成A2至A4轮融资,总金额近3亿元人民币。此前,A2轮融资由 蚂蚁集团投资,近期A3、A4轮融资由北京市人工智能产业投资基金、国科投资及光源资本投资,光 源资本继续担任独家财务顾问。融资将主要用于提升技术研发能力、扩展算力资源以及建设人才团 队,加速产品功能迭代与市场覆盖,持续推动AI视频生成技术的普惠。 截至目前,爱诗科技的核心AI视频生成产品PixVerse全球用户数超1200万,月活跃用户数近600 万。 自2024年10月PixVerse V3版本发布后,"毒液变身"等创意特效功能席卷海内外社交媒体, 为亿万用户提供了前所未有的AI视频生成体验。PixVerse不仅在文生视频和图生视频能力上保持全 球领先,还上线了Video to Video(视频生视频)功能,可基于实拍视频或影视片段进行延长生 成,进一步拓宽了AI视频创作的可能性。 2024年12月,PixVerse 移动App在海外上线,可通过官网下载体验。同时,爱诗科技已面向企业 用户开放技术 ...
对话 PixVerse 王长虎:AI 视频生成可能通向新平台,Sora 只领先几个月
晚点LatePost· 2024-04-30 10:25
"抖音就是从 15 秒的视频做起来的。" 文丨王与桐 编辑丨程曼褀 今年 2 月 OpenAI 发布了由视频模型 Sora 生成的视频,时长可达 60 秒并且视频内容丝滑、连贯、 逼真。 一张梗图在 Sora 发布后流传于社交媒体:Sora 是坐在宝座上的巨大神像,下面跪着一众渺小的膜拜 者,包括 Runway、Pika、SVD、PixVerse 等十多个视频生成模型或产品。 Sora 出现后,这张梗图开始流传。 "能被放在第一排,我们很高兴。" 推出 PixVerse 的爱诗科技创始人兼 CEO 王长虎说。 PixVerse 是 "膜拜者" 中唯一一个由中国公司开发的产品,网页端产品在今年 1 月上线,根据第三方 监测平台 SimilarWeb 数据,PixVerse 3 个月内达到了超过 140 万的月访问量,去年 11 月上线的 Pika 现在是超 200 万的月访问量。 做出 PixVerse 的爱诗科技由王长虎在 2023 年 4 月创立。2017 年初 ,王长虎加入字节跳动,担任 AI Lab 视觉技术负责人。作为在微软亚洲研究院学习和工作十余年的计算机视觉专家,王长虎带领 技术团队,研发了抖音、 ...
晚点独家丨蚂蚁投资视频生成模型公司爱诗科技;奈雪投资人加入茶颜悦色
晚点LatePost· 2024-04-23 11:12
本期关注企业:蚂蚁金服、茶颜悦色、爱诗科技。 蚂蚁集团投资视频生成模型公司爱诗科技,由字节前视觉技术负责人王长虎创立 今年 2 月 OpenAI 发布 Sora 后,投资人对视频生成模型的判断更趋割裂:有人认为,OpenAI 已碾压其他公司, 创业机会不再;另一派观点是,Sora 证明视频生成模型路线清晰、成果可复制,这反而会给更多公司机会。 乐观者已用钱做出了选择。《晚点 LatePost》独家获悉,蚂蚁集团已于近期独家投资了中国视频生成大模型公司 爱诗科技的 A2 轮,该轮金额超过 1 亿元人民币。 接近蚂蚁的人士说,蚂蚁除自研大模型并落地应用外,也在持续关注行业的前瞻探索,围绕大模型技术能力、产 业应用和 AI 算力等核心技术和生态,已陆续投资了智谱 AI、月之暗面等大模型创业公司和专注多模态的生数科 技等。 爱诗科技成立于 2023 年 4 月,目前团队约有 30 人,创始人兼 CEO 王长虎曾任字节跳动视觉技术负责人,在视 频理解、数据处理、内容安全和视频生成等领域都有积累。 爱诗科技既做视频生成大模型,又做面向内容创作者和普通人的视频生成产品。 爱诗科技称自己 2023 年 6 月以来就尝试 Di ...