AI视频

Search documents
中信证券:预计快手(01024)可灵TAM规模超千亿美元,25-30年收入CAGR约44.7%
智通财经网· 2025-06-09 03:58
3. 商业模式:海外为主,P/B并重。 可灵当前主要收入模式为面向个人用户(P端)的会员订阅和面向企业 客户(B端)的API接入。目前70%收入来自专业P端用户,30%来自B端客户;70%收入来自海外市场(得 益于成熟的用户付费习惯和定价优势),30%来自国内。截至2025年3月,可灵AI全球用户超2200万, 为超1万家企业提供API服务。 4. 增长驱动与收入预测:高增长可期。 核心增长驱动包括:全球专业内容创作者数量增长(预计年增 10%)、可灵MAU渗透率持续提升(预计从2024E的5%升至2030E的30%)、付费率提升(从2024E的 1.5%升至2030E的5%)、以及中短期ARPPU(单付费用户平均收入)的提升趋势。基于此,预计2025- 2030年可灵收入CAGR达44.7%。 5. 估值增量:36-48亿美元。 参考同业估值(如Runway在2024年12月ARR 8400万美元对应30-40亿美元 估值,PS 36-48x),考虑到可灵评测排名、流量表现、商业规模均优于Runway,中信证券保守给予可 灵36-48x PS(基于当前ARR 1亿美元),对应估值增量约36-48亿美元。 智 ...
赛道Hyper | PixVerse国内版上线:AI视频市场生变?
Hua Er Jie Jian Wen· 2025-06-08 02:32
所谓SE(3)等变网络,是一种在三维空间中,具有旋转和平移等变性质的神经网络,能自动学习对旋 转和平移等变的特征表示,从而在各种三维相关的任务中取得更好的性能。 作者:周源/华尔街见闻 全球用户量领先的AI视频生成平台——PixVerse,于6月6日推出国内版产品"拍我AI",同步上线网页端 及移动端应用,并开放最新V4.5模型供用户使用。 V4.5模型在生成速度、画面精细度及多主体控制等方面实现了提升。 首先是专业运镜系统,集成20余种电影镜头模板(如希区柯克变焦和一镜到底等),通过深度学习分析 经典电影镜头运动轨迹,实现AI自动化的专业运镜。 用户可调节焦距变化速度(0.1-10倍速)、镜头抖动幅度(0-5 级模拟斯坦尼康效果)等参数,生成具 有电影质感的动态画面。 其次,多模态融合技术,支持最多8张图片输入,通过SE(3)等变网络,实现多图像空间关系解算, 结合Transformer的时序注意力机制保证画面连贯性,自动生成包含起承转合的20秒完整片段。 通俗点说,SE(3)等变网络的工具价值就是:给它"看"一个玩具汽车3D模型,正着放、倒着放、挪到 左边右边,这个网络都能明白这是同一辆玩具汽车,还能自动 ...
全球圈粉6000万,被国内粉丝催着上线,PixVerse「国内版」一手实测来了!
机器之心· 2025-06-07 03:59
机器之心原创 这不免令人好奇,到底是什么样的产品,让国内用户如此期盼? 直到最近,这个谜底终于揭晓。如果你是一个拥有天马行空想象力的人,你一定会被这个产品吸引 —— 什么「贝多芬变身肌肉猛男」、「AI 三巨头之世界爆照我 拍照」、「萌宠眨眼变手办」…… 只要你能想出来,爱诗科技的新产品统统能帮你实现。 这个新产品名叫「 拍我 AI 」,是已经在全球用户中打出名气的视频生成应用「PixVerse」的国内版,目前已经在各大应用商店上线,网页端还提供深度体验。 在上手试了一下之后,我们发现「拍我 AI」可玩度很高。即使完全不会写提示词,你也不会觉得无聊,因为它有 上百种 模板 。只要点击「做同款」,然后替换 一下图片就可以了。所以,如果你最近在社交媒体上刷到一些很火的 AI 视频,但又不知道怎么做,去「拍我 AI」网页端翻翻,有很大的几率找到同款。 作者:张倩 恭喜国内视频创作者!从此,大家又多了一个好用的 AI 视频生成工具。 「你们的产品到底什么时候在国内上线?」 最近,爱诗科技也体验了一把小说作者的待遇 —— 打开后台,发现私信全是「催上线」的信息。 当然,如果你是专业玩家,「拍我 AI」可玩的就不止模板了。 ...
爱诗王长虎、谢旭璋:“不会创业” 的创始人,怎么做出用户量第一的 AI 视频产品
晚点LatePost· 2025-06-06 11:05
王长虎 爱诗科技创始人兼 CEO 谢旭璋 爱诗科技联合创始人 解锁 AI 视频的病毒传播后,爱诗推出 PixVerse 中国版 "拍我 AI"。 文 丨 王与桐 编辑 丨 程曼祺 "不够年轻。"2023 年初,我们第一次和投资人聊到正在筹备创业的王长虎时,这是对方的第一反应。 一种观点是,35 岁以下的创始人更适合大模型创业,不管是做模型还是应用——模型技术迭代快,年 轻人学得更快;而做应用要洞察用户,AI 的早鸟用户就是年轻人。 可偏偏,在数家视频生成创业公司被收购或关停时,是 80 后的王长虎,搭配联创 90 后谢旭璋,带着 既做模型,也做应用的爱诗科技跑到了行业头部。 爱诗的全球用户现在已超过 6000 万,是可灵当前用户数的近 3 倍; 其中,上线刚 6 个多月的 PixVerse 移动端月活已超过 1600 万。 可灵、MiniMax 海螺、Pika、Runway 等产品主要服务专业视频制作者,爱诗则在有相近功能的网页 端产品之外,也做了面向 to C 用户的视频生成移动端产品,玩法又潮、又简单: 借助 "模版",用户上传照片、等上几秒后,就可以把任何人物封装成一个小玩具,平地入海、变身美 人鱼,让 ...
Sora免费首秀遇冷,微软能否借其重振AI视频领域雄风?
Sou Hu Cai Jing· 2025-06-05 13:33
微软终于将Sora模型免费开放给公众,但这一举措似乎来得有些迟。近日,微软Bing宣布在其应用中新增了Bing视频 创作器功能,该功能基于OpenAI的Sora模型,允许用户通过简单的文本提示生成视频。这也是Sora首次面向大众免费 开放使用。 几乎在同一时间,另一家公司Manus也推出了其原生文生视频功能,并嵌入到了自家的Agent工作流中。这两家公司几 乎同时在其产品生态中引入文生视频功能,不禁让人质疑微软这一步棋究竟慢了多少。 Sora模型自诞生之日起便备受瞩目,甚至被誉为"AI视频领域的牛顿时刻"。然而,不断延期的发布时间、高昂的定价 以及复杂的安全风险等问题,让市场对它的期待逐渐降温。如今,尽管微软通过Bing免费上线了视频创作器功能,但 Sora的表现却显得有些差强人意。 在实际测试中,Bing视频创作器在视频长度、画面比例、生成速度以及多模态融合功能等方面都存在明显短板。生成 的视频质量也远不及市场上的其他同类产品。例如,在对比测试中,Bing视频创作器生成的羊驼跳舞视频画面主体辨 识度低,背景AI感强烈,整体质感较为粗糙。 从Sora模型首次曝光到现在,整个事态的发展颇具戏剧性。微软一直对So ...
从“牛顿时刻”到“鸡肋时刻”:微软免费Sora的尴尬首秀
Hu Xiu· 2025-06-05 10:34
一个是默默关注Sora、OpenAI背后的"大东家",另一个则是AI Agent里的"新秀",两方在自家产品生态中上马文生视 频的时间点几乎是一样的。可见,微软这一步棋到底慢了多久。 从Sora代号第一次问世到现在,整体局面的发展路径很像:"微软想要,OpenAI不给,但最后微软如愿以偿得到了 Sora的副产品"。 微软将Sora免费了,但却已经晚了。 前天,微软Bing宣布在其应用程序中推出 Bing 视频创作器(Bing Video Creator),该功能基于OpenAI的Sora模型,允 许用户通过文本提示词生成视频。这也是Sora首次面向用户免费开放。 就在昨天,Manus推出原生文生视频,嵌入进了自家Agent的工作流中。 为什么说它是Sora的副产品?因为微软上线的Bing 视频创作器从产品力和宣传上来讲,很难说得上是个完整的产品。 当微软终于宣布将它免费向用户开放时,这个消息并未掀起预期中的热潮,反而透着一股尴尬的迟到感。网友对这款 产品的"自来水"评价很差,甚至直言:我们已经有了可灵和Veo,为何还用Sora? Sora,这个曾被OpenAI寄予厚望、甚至被誉为"AI视频领域的牛顿时刻"的模 ...
Manus AI能生成视频了,实测发现不少翻车名场面,网友:有种2011年的美
3 6 Ke· 2025-06-05 09:26
当代 AI 视频创作者有三件套:提示词、积分、以及抽卡。 继 Veo 3 刚刚掀起一轮小高潮后,Manus 也能生成视频了,功能挺全,经过实测,在 Agent 加持下, 支持图生视频、文生视频等标配功能。 该功能目前已经向 Basic、Plus 和 Pro 用户开放抢先体验。 先说结论,你要真指望它一句话秒出大片,那还是先降低心理预期。 高情商,不是不能用,只是抽卡的概率有些感人;低情商,用网友的话来说,花里胡哨,视频质量也有种 2011 年的美。 按照过往惯例,Manus 大概率也是套壳某家 AI 视频模型,但鉴于目前还没厂商认领,我们也不好断言,而经过一轮实测,我们也总结出几个特点: 图生视频:效果能打,但也随机抽卡 从体验上看,Manus 的图生视频明显要比文生视频靠谱得多。 我上传了一张威尔史密斯的照片作为参考,让其生成吃面的视频,效果还算可接受,风格统一、角色一致性尚可。 肤色和构图风格维持得比较好,相比于当前的视频主流模型,算得上是正常发挥。 并且,5 秒的视频仅扣了 44 积分,考虑到如果是普通用户,那么开通一个 Basic 账号,积分也足够用了。 抽卡严重,基本默认生成约 5 秒的「默剧」片段 ...
腾讯开源的HunyuanVideo-Avatar上传一张图+一段音频,虚拟角色“活”过来
Sou Hu Cai Jing· 2025-06-04 02:48
今天早上,GitHub上突然冒出一个让AI圈炸锅的项目——腾讯开源的HunyuanVideo-Avatar。 这是一个开源的视频生成工具,上传一张图+一段音频,就能让图中的人物、动物甚至虚拟角色"活"过来,开口说话、唱歌、演相声! 连爱因斯坦和奥黛丽·赫本都能被AI"复活"同台说相声,这类工具其实之前就有,那腾讯这次开源的HunyuanVideo-Avatar有什么魅力呢,一起来看看? 一、你的照片会"演戏" HunyuanVideo-Avatar的核心逻辑就像个"数字人导演",它能从一张静态图中读懂场景,再根据音频的情感让角色动起来。而这一切的秘密武器,藏在三个 模块里: 1、告别AI生成的"网红脸"! 传统模型容易生成"千人一面"的角色,而腾讯用这个模块直接把你的照片"刻"进模型里。能精准保留原图细节,连衣服褶皱和背景光影都保持一致。 3、多人飙戏不串场! 看Demo,视频中两个角色的唇形、表情、手势完全独立,连互动时的眼神交流都自然得像真人演员。 二、创意可以成真 HunyuanVideo-Avatar可以在这些场景应用: 电商直播:上传商品图+促销文案,AI主播24小时在线带货,还能根据"限时秒杀"的 ...
腾讯混元推出AI数字人技术:一张照片配音频即可生成唱歌视频
Feng Huang Wang· 2025-05-28 09:23
官方表示,HunyuanVideo-Avatar在主体一致性和音画同步准确度方面已达到业内领先水平,超越现有 开源和闭源解决方案。在画面动态性和肢体自然度表现上,与其他主流闭源方案处于同等技术水准。 目前,HunyuanVideo-Avatar的单主体功能已在腾讯混元官方网站开放体验,用户可通过"模型广场-混元 生视频-数字人-语音驱动"路径访问相关功能。系统当前支持不超过14秒的音频文件上传,后续将逐步 开源更多高级功能模块。 腾讯此次开源举措将推动AI视频生成技术的普及应用,为短视频创作、电商营销、广告制作等垂直领 域提供低成本的技术解决方案。 凤凰网科技讯 5月28日,腾讯混元团队联合腾讯音乐天琴实验室正式发布并开源语音数字人模型 HunyuanVideo-Avatar。该技术仅需用户提供一张人物图像和一段音频文件,即可自动生成包含自然表 情、精准唇形同步以及全身动作的动态视频内容。 HunyuanVideo-Avatar基于腾讯混元视频大模型与MuseV技术深度融合开发。该模型具备强大的多模态理 解能力,能够自动识别输入图像中的人物环境信息以及音频所承载的情感内容,进而生成高度匹配的视 频片段。以实际 ...
“AI,你帮我挑个木瓜?”实测豆包视频通话功能 一场AI“视觉交互”争夺战已打响
Mei Ri Jing Ji Xin Wen· 2025-05-27 23:49
每经记者|李宇彤 杨昕怡 每经编辑|文多 国内AI(人工智能)视频交互赛道再添重磅玩家。 近日,字节跳动旗下AI智能助手"豆包"的App上线视频通话功能,支持视频聊天问答。据官方介绍,本 次升级基于视觉推理模型,支持联网搜索。 《每日经济新闻》记者实测发现,豆包的视频通话功能用处不少,包括识别水果成熟度这样的日常用 途。此外,在识别物品时,豆包更展现出持续记忆和逻辑推理能力。 5月27日,一位大模型算法工程师接受《每日经济新闻》记者微信采访时表示,豆包在视频通话中展现 出的视频理解与语音交互能力,在中文语境中处于第一梯队。 继文生视频大模型后,字节在AI多模态领域又迈出关键一步。 能打视频电话的豆包,效果如何? "视觉是人类了解这个世界最重要的方式,对于大模型来说也是如此。"在去年12月举行的"2024火山引 擎FORCE原动力大会·冬"上,火山引擎总裁谭待发布了豆包视觉理解模型,称该模型具备更出色的内容 识别、理解、推理、视觉描述和创作等能力。 5个月后,这一新模型的能力让所有豆包用户"眼见为实"了。 和豆包打个视频电话,是否真的能解决上述这些生活问题呢?百闻不如一见,《每日经济新闻》记者近 日以挑选水果、 ...