AI视频生成

Search documents
MiniMax秀了波AI杂技视频,视频生成赛道又卷起来了
Di Yi Cai Jing· 2025-06-18 08:47
这仍然只是技术迭代的初期。 AI视频生成赛道又热闹起来了。4月,快手可灵发布2.0视频生成模型,6月,字节跳动发布了即梦3.0 Pro视频模型,就在昨天,谷歌宣布Veo3正式上线,今 天MiniMax也加入混战队列,开始卷性价比了。 6月18日,MiniMax在海内外官方平台宣布,新视频生成模型海螺AI(海螺02)上线,同时发布了一段大秀杂技的AI视频。官方表示,这段视频是由3位艺术 家耗时1.5天,使用海螺02生成的多个6-10s视频,再拼接剪辑而成。 杂技画面对AI视频生成来说一直是较有难度的内容,此前AI生成画面时往往肢体拼接混乱,无法准确模仿复杂的人类动作。从此次画面效果来看无论是光 影、人类动作、物理模仿都完成得很好。 不过,需要指出的是,有AI创作者对第一财经表示,AI视频生成还涉及一个成功率的问题,因此样片是完美的,但过程中他们进行了多少次"抽卡",外界并 不能知晓。所谓抽卡指的是, AI往往不是一次就能成功生成用户想要的画面,可能会有出错的概率,因此行业会选择多次生成直到得到自己想要的画面。 不过,即便如此,上述AI创作者认为,这次海螺AI的更新是不错的,行业整体水平都在提升。 在竞技场Art ...
MiniMax秀了波AI视频杂技:越看越惊艳,指令遵循太强了
量子位· 2025-06-18 00:54
白交 发自 凹非寺 量子位 | 公众号 QbitAI 这样复杂精致的视频效果,都是AI生成的?都是最新国产AI大模型的新能力?? 没错,都来自MiniMax刚刚发布海螺2.0版本,能处理极端物理情况,原生支持1080P。 它可以这样—— 提示词:The character in the frame juggles throwing knives with fast and fluid motion. 画面中的人物以快速、流畅的动作玩弄投掷刀具的游戏 即便是这种快速变化的场景也可以hold。 官方介绍说,这次新升级的大模型,在指令遵循、生成质量都达到了一流水平,其成本效率破纪录。 Hailuo02 在官方释出的最新案例中,能够看到此次升级的一些细节。 还可以在空中旋转跳跃不停歇—— 提示词:Acrobatic performance:a performer swings rapidly on an aerial executing high-difficulty moves as the camera follows. 杂技表演:表演者在空中快速摆动,做出高难度动作,镜头跟随。 比如在光影处理上。 即便是比较超 ...
爱诗科技联合举办 CVPR 2025第二届高效端侧生成技术研讨会(EDGE)
Cai Fu Zai Xian· 2025-06-17 08:15
爱诗科技旗下AI视频生成平台PixVerse作为本次研讨会联合举办方,很荣幸与全球顶尖的学者专家们一 起学术共创,行业赋能! 近日,CVPR 2025 第二届高效端侧生成技术研讨会(EDGE)于美国田纳西州纳什维尔市圆满落幕,研讨 会期间《AdaVid:Adaptive Video-Language Pretraining(面向多场景迁移的自适应视频-语言预训练框架)》 和《Scaling On-Device GPU Inference for Large Generative Models(生成式大模型端侧GPU推理的规模化 加速)》两篇论文拔得头筹。 ...
中信证券:预计快手(01024)可灵TAM规模超千亿美元,25-30年收入CAGR约44.7%
智通财经网· 2025-06-09 03:58
3. 商业模式:海外为主,P/B并重。 可灵当前主要收入模式为面向个人用户(P端)的会员订阅和面向企业 客户(B端)的API接入。目前70%收入来自专业P端用户,30%来自B端客户;70%收入来自海外市场(得 益于成熟的用户付费习惯和定价优势),30%来自国内。截至2025年3月,可灵AI全球用户超2200万, 为超1万家企业提供API服务。 4. 增长驱动与收入预测:高增长可期。 核心增长驱动包括:全球专业内容创作者数量增长(预计年增 10%)、可灵MAU渗透率持续提升(预计从2024E的5%升至2030E的30%)、付费率提升(从2024E的 1.5%升至2030E的5%)、以及中短期ARPPU(单付费用户平均收入)的提升趋势。基于此,预计2025- 2030年可灵收入CAGR达44.7%。 5. 估值增量:36-48亿美元。 参考同业估值(如Runway在2024年12月ARR 8400万美元对应30-40亿美元 估值,PS 36-48x),考虑到可灵评测排名、流量表现、商业规模均优于Runway,中信证券保守给予可 灵36-48x PS(基于当前ARR 1亿美元),对应估值增量约36-48亿美元。 智 ...
赛道Hyper | PixVerse国内版上线:AI视频市场生变?
Hua Er Jie Jian Wen· 2025-06-08 02:32
所谓SE(3)等变网络,是一种在三维空间中,具有旋转和平移等变性质的神经网络,能自动学习对旋 转和平移等变的特征表示,从而在各种三维相关的任务中取得更好的性能。 作者:周源/华尔街见闻 全球用户量领先的AI视频生成平台——PixVerse,于6月6日推出国内版产品"拍我AI",同步上线网页端 及移动端应用,并开放最新V4.5模型供用户使用。 V4.5模型在生成速度、画面精细度及多主体控制等方面实现了提升。 首先是专业运镜系统,集成20余种电影镜头模板(如希区柯克变焦和一镜到底等),通过深度学习分析 经典电影镜头运动轨迹,实现AI自动化的专业运镜。 用户可调节焦距变化速度(0.1-10倍速)、镜头抖动幅度(0-5 级模拟斯坦尼康效果)等参数,生成具 有电影质感的动态画面。 其次,多模态融合技术,支持最多8张图片输入,通过SE(3)等变网络,实现多图像空间关系解算, 结合Transformer的时序注意力机制保证画面连贯性,自动生成包含起承转合的20秒完整片段。 通俗点说,SE(3)等变网络的工具价值就是:给它"看"一个玩具汽车3D模型,正着放、倒着放、挪到 左边右边,这个网络都能明白这是同一辆玩具汽车,还能自动 ...
全球圈粉6000万,被国内粉丝催着上线,PixVerse「国内版」一手实测来了!
机器之心· 2025-06-07 03:59
机器之心原创 这不免令人好奇,到底是什么样的产品,让国内用户如此期盼? 直到最近,这个谜底终于揭晓。如果你是一个拥有天马行空想象力的人,你一定会被这个产品吸引 —— 什么「贝多芬变身肌肉猛男」、「AI 三巨头之世界爆照我 拍照」、「萌宠眨眼变手办」…… 只要你能想出来,爱诗科技的新产品统统能帮你实现。 这个新产品名叫「 拍我 AI 」,是已经在全球用户中打出名气的视频生成应用「PixVerse」的国内版,目前已经在各大应用商店上线,网页端还提供深度体验。 在上手试了一下之后,我们发现「拍我 AI」可玩度很高。即使完全不会写提示词,你也不会觉得无聊,因为它有 上百种 模板 。只要点击「做同款」,然后替换 一下图片就可以了。所以,如果你最近在社交媒体上刷到一些很火的 AI 视频,但又不知道怎么做,去「拍我 AI」网页端翻翻,有很大的几率找到同款。 作者:张倩 恭喜国内视频创作者!从此,大家又多了一个好用的 AI 视频生成工具。 「你们的产品到底什么时候在国内上线?」 最近,爱诗科技也体验了一把小说作者的待遇 —— 打开后台,发现私信全是「催上线」的信息。 当然,如果你是专业玩家,「拍我 AI」可玩的就不止模板了。 ...
爱诗王长虎、谢旭璋:“不会创业” 的创始人,怎么做出用户量第一的 AI 视频产品
晚点LatePost· 2025-06-06 11:05
王长虎 爱诗科技创始人兼 CEO 谢旭璋 爱诗科技联合创始人 解锁 AI 视频的病毒传播后,爱诗推出 PixVerse 中国版 "拍我 AI"。 文 丨 王与桐 编辑 丨 程曼祺 "不够年轻。"2023 年初,我们第一次和投资人聊到正在筹备创业的王长虎时,这是对方的第一反应。 一种观点是,35 岁以下的创始人更适合大模型创业,不管是做模型还是应用——模型技术迭代快,年 轻人学得更快;而做应用要洞察用户,AI 的早鸟用户就是年轻人。 可偏偏,在数家视频生成创业公司被收购或关停时,是 80 后的王长虎,搭配联创 90 后谢旭璋,带着 既做模型,也做应用的爱诗科技跑到了行业头部。 爱诗的全球用户现在已超过 6000 万,是可灵当前用户数的近 3 倍; 其中,上线刚 6 个多月的 PixVerse 移动端月活已超过 1600 万。 可灵、MiniMax 海螺、Pika、Runway 等产品主要服务专业视频制作者,爱诗则在有相近功能的网页 端产品之外,也做了面向 to C 用户的视频生成移动端产品,玩法又潮、又简单: 借助 "模版",用户上传照片、等上几秒后,就可以把任何人物封装成一个小玩具,平地入海、变身美 人鱼,让 ...
Sora免费首秀遇冷,微软能否借其重振AI视频领域雄风?
Sou Hu Cai Jing· 2025-06-05 13:33
微软终于将Sora模型免费开放给公众,但这一举措似乎来得有些迟。近日,微软Bing宣布在其应用中新增了Bing视频 创作器功能,该功能基于OpenAI的Sora模型,允许用户通过简单的文本提示生成视频。这也是Sora首次面向大众免费 开放使用。 几乎在同一时间,另一家公司Manus也推出了其原生文生视频功能,并嵌入到了自家的Agent工作流中。这两家公司几 乎同时在其产品生态中引入文生视频功能,不禁让人质疑微软这一步棋究竟慢了多少。 Sora模型自诞生之日起便备受瞩目,甚至被誉为"AI视频领域的牛顿时刻"。然而,不断延期的发布时间、高昂的定价 以及复杂的安全风险等问题,让市场对它的期待逐渐降温。如今,尽管微软通过Bing免费上线了视频创作器功能,但 Sora的表现却显得有些差强人意。 在实际测试中,Bing视频创作器在视频长度、画面比例、生成速度以及多模态融合功能等方面都存在明显短板。生成 的视频质量也远不及市场上的其他同类产品。例如,在对比测试中,Bing视频创作器生成的羊驼跳舞视频画面主体辨 识度低,背景AI感强烈,整体质感较为粗糙。 从Sora模型首次曝光到现在,整个事态的发展颇具戏剧性。微软一直对So ...
从“牛顿时刻”到“鸡肋时刻”:微软免费Sora的尴尬首秀
Hu Xiu· 2025-06-05 10:34
一个是默默关注Sora、OpenAI背后的"大东家",另一个则是AI Agent里的"新秀",两方在自家产品生态中上马文生视 频的时间点几乎是一样的。可见,微软这一步棋到底慢了多久。 从Sora代号第一次问世到现在,整体局面的发展路径很像:"微软想要,OpenAI不给,但最后微软如愿以偿得到了 Sora的副产品"。 微软将Sora免费了,但却已经晚了。 前天,微软Bing宣布在其应用程序中推出 Bing 视频创作器(Bing Video Creator),该功能基于OpenAI的Sora模型,允 许用户通过文本提示词生成视频。这也是Sora首次面向用户免费开放。 就在昨天,Manus推出原生文生视频,嵌入进了自家Agent的工作流中。 为什么说它是Sora的副产品?因为微软上线的Bing 视频创作器从产品力和宣传上来讲,很难说得上是个完整的产品。 当微软终于宣布将它免费向用户开放时,这个消息并未掀起预期中的热潮,反而透着一股尴尬的迟到感。网友对这款 产品的"自来水"评价很差,甚至直言:我们已经有了可灵和Veo,为何还用Sora? Sora,这个曾被OpenAI寄予厚望、甚至被誉为"AI视频领域的牛顿时刻"的模 ...
Manus AI能生成视频了,实测发现不少翻车名场面,网友:有种2011年的美
3 6 Ke· 2025-06-05 09:26
当代 AI 视频创作者有三件套:提示词、积分、以及抽卡。 继 Veo 3 刚刚掀起一轮小高潮后,Manus 也能生成视频了,功能挺全,经过实测,在 Agent 加持下, 支持图生视频、文生视频等标配功能。 该功能目前已经向 Basic、Plus 和 Pro 用户开放抢先体验。 先说结论,你要真指望它一句话秒出大片,那还是先降低心理预期。 高情商,不是不能用,只是抽卡的概率有些感人;低情商,用网友的话来说,花里胡哨,视频质量也有种 2011 年的美。 按照过往惯例,Manus 大概率也是套壳某家 AI 视频模型,但鉴于目前还没厂商认领,我们也不好断言,而经过一轮实测,我们也总结出几个特点: 图生视频:效果能打,但也随机抽卡 从体验上看,Manus 的图生视频明显要比文生视频靠谱得多。 我上传了一张威尔史密斯的照片作为参考,让其生成吃面的视频,效果还算可接受,风格统一、角色一致性尚可。 肤色和构图风格维持得比较好,相比于当前的视频主流模型,算得上是正常发挥。 并且,5 秒的视频仅扣了 44 积分,考虑到如果是普通用户,那么开通一个 Basic 账号,积分也足够用了。 抽卡严重,基本默认生成约 5 秒的「默剧」片段 ...