Dream Machine

Search documents
视频模型赛道“热闹”起来了,但变现仍不容易
Di Yi Cai Jing· 2025-07-05 08:19
视频大模型行业暂时不会出现一家独大的局面。 近一个月的视频模型产品更新之前,Sora的热度已带动一批新品面世。包括2024年上半年的爱诗科技PixVerse、Runway Gen-3、Luma Dream Machine,下半 年的生数科技Vidu、智谱清影、字节跳动PixelDance、MiniMax海螺等。 一方面,视频模型你追我赶。据AGI-Eval(上海交通大学、同济大学等高校和机构合作发布的大模型评测社区),2024年12月,PixVerse-V3、可灵1.5、 Video-01的得分(评测维度包括视频-文本一致性、视频质量、运动质量等)超越Sora。 但同时,受限于技术成熟度、商业化、成本高等因素,视频模型的创业热度并不及AI应用层,主要由大型互联网/科技企业组成,由爱诗科技、生数科技、 Pika、Runway、MiniMax等明星创业公司补充。 此前,MiniMax创始人闫俊杰表示,视频类工作复杂度比文本更难,上下文文本很长,一个5秒的视频就有几M(兆字节,MB)大小,但文本领域,5秒看 100个字的大小可能都不到1K(千字节,KB),这是几千倍的存储差距。该差距带来的挑战便是如果通过基本文本构 ...
抽象小视频秒变特效大片:原视频精髓不变角色环境任意换,Luma出品
量子位· 2025-06-05 08:32
AI爆改视频可以有多夸张? 这么抽象的"过家家"小船,AI直接给原地飞升为在汹涌海浪中前行的帆船。 不仅画面精细、大片视效果,还保留了原视频的动作运镜。 鹭羽 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 或者是进行风格迁移,"给手部扫个X光"。 动作、位置都与原视频几乎一致。 这感觉,自己在家就能当导演手搓CG大片了。 还要什么动捕、建模、特效渲染啊,AI直接全部搞定。 △ 康伯巴奇如何"成为"史矛革巨龙 这就是AI视频模型最新玩法, Modify Video ,直译就是改造视频,由 Luma AI 推出。 它能 重新"想象" 任何视频,类似于人类拍个草稿,AI负责搞定你想要的各种后期视效。 最关键是能对角色、场景、动作进行精准控制,只编辑你想编辑的元素,不会篡改本来的人物动作。 背着孩子骑大马,现在也能秒变驯龙高手。 要知道,现在很多AI视频生成模型都被诟病不受控制,容易让生成的人物、物体动作诡异或者不符合物理规律。 △ 右边为runway效果,人物凭空产生一件夹克 一经发布,这个玩法就在推特火了。 大家在惊呼amazing同时,也自己试玩了一把,效果确实非常nice。 先看下面这个小哥,本来在停 ...
短短30秒,颠覆整个行业
混沌学园· 2025-05-06 11:17
人类文明的每一次范式跃迁,都始于一场看似微小的 "认知越狱"。 当古登堡将活字印刷注入羊皮纸的褶皱,文字从此挣脱了抄写员的镣铐; 当第一束光穿过卢米埃尔兄弟的放映机,影像便不再是贵族沙龙的特权。 今天,我们将站在另一场 "表达革命"的临界点: 短短 30秒,AI正在颠覆内容产业的底层逻辑 , 这是 一场商业叙事方式的重构 。 当 AI视频, 让内容生产 从幻觉到现实 , 我们终于要直面那个终极命题: 若技术能精准翻译人类的情 感,内容生产的 "第一性原理"是否正在被重构? 文 / 赵文娜 混沌商业研究团队 可灵 2.0震撼刷屏 但"震撼"不是重点 最近 , AI视频再次点燃行业想象力。 在所有 "让人误以为是真的"的AI视频产品中,目前只有两个名字引发了广泛热议:一个是OpenAI尚未 公测的Sora,另一个,则是已经开放体验、正在朋友圈批量"炸群"的快手可灵2.0。 两者很像 ——都能生成近乎影视级别的短片,具备复杂物理逻辑、镜头语言和拟人表演。 两者又很不一样: Sora像是一支来自未来的预告片,拥有惊人的远景调度和沉浸镜头,但仍停留在少数内部Demo ,惊艳 但离落地尚远; 相比之下, 可灵 2.0则更 ...