视频生成

Search documents
40秒生成1080P视频,3.6元一条,字节这次又要掀桌子了?藏师傅Seedance 1.0 Pro实测
歸藏的AI工具箱· 2025-06-11 08:42
朋友们好,我是歸藏(guizang)。 今天上午的火山引擎Force原动力大会上字节发布了 Seedance 1.0 Pro 视频生成模型。 也就是 即梦里面的视频3.0 pro 模型。 我也提前测试了一下,发现这次字节的视频模型真的站起来了。 在图生和文生的提示词理解、画面细节、物理表现一致性理解等方面都无可挑剔,非常强悍,而且还是 原生 1080P 分辨率。 在 Artificial Analysis 上,Seedance 1.0 文生视频、图生视频的成绩都在第一,比 Veo 3 高了很多。 | | Text to Video | Image to Video | | | | | --- | --- | --- | --- | --- | --- | | Creator | Model | | Arena ELO | 95% CI | # Appearances | | ht ByteDance Seed | Seedance 1.0 | | 1299 | -13/+13 | 4,947 | | G Google | Veo 3 Preview | | 1252 | -10/+10 | 8,033 | | ...
豆包视频生成模型Seedance 1.0 pro正式发布 实时语音模型同步全量上线
news flash· 2025-06-11 05:29
今日,在"2025火山引擎春季FORCE原动力大会"上,豆包视频生成模型Seedance1.0pro正式发布。火山 引擎总裁谭待表示,Seedance1.0pro可以做到无缝多镜头叙事、多动作及随心运镜,并且稳定运动并保 持真实美感。而Seedance1.0pro的价格为0.015元/千tokens(语言生成模型在运作时的最小工作单元)。此 外,会上谭待还宣布豆包实时语音模型全量上线,正式发布了语音博客模型。(每日经济新闻) ...
字节跳动推出视频模型Seedance 1.0 pro
news flash· 2025-06-11 03:41
字节跳动推出视频模型Seedance 1.0 pro 金十数据6月11日讯,字节跳动旗下火山引擎举办FORCE原动力大会,在会上,火山引擎发布了视频生 成模型Seedance 1.0 pro。 ...
豆包发布视频生成模型Seedance1.0 pro
news flash· 2025-06-11 03:38
豆包发布视频生成模型Seedance1.0pro,价格0.015元/千tokens,制作5秒的1080p视频约3.67元/个。同 时,豆包的实时语音模型全量上线。(科创板日报) ...
理想新一代世界模型首次实现实时场景编辑与VLA协同规划
理想TOP2· 2025-06-11 02:59
以下文章来源于自动驾驶之心 ,作者Anthony Chen等 自动驾驶之心 . 在TOP2 翻阅的数十篇理想论文中,这是第一次论文作者出现了非大陆拼音名,分别为Anthony Chen和Kurt Keutzer。 论文核心4点突破: 几何条件驱动:用3D渲染替代数值控制信号,解决动作漂移问题。 动态编辑机制:在静态点云中注入可控运动,平衡效率与灵活性。 最小化训练代价:冻结主干模型 + 轻量化适配器,实现数据高效训练。 自动驾驶开发者社区,关注自动驾驶、计算机视觉、感知融合、BEV、部署落地、定位规控、领域方案等,坚持为领域输出最前沿的技术方向! 2025年5月28日北大&理想&伯克利 发布GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control。 Anthony Chen,Wenzhao Zheng, Yida Wang为同等贡献,Shanghang Zhang为通讯作者。 Anthony Chen同时是北大和理想的,Wenzhao Zheng是伯克利的,Yida Wang 是理想的。Shanghang Zh ...
中信证券:预计快手(01024)可灵TAM规模超千亿美元,25-30年收入CAGR约44.7%
智通财经网· 2025-06-09 03:58
3. 商业模式:海外为主,P/B并重。 可灵当前主要收入模式为面向个人用户(P端)的会员订阅和面向企业 客户(B端)的API接入。目前70%收入来自专业P端用户,30%来自B端客户;70%收入来自海外市场(得 益于成熟的用户付费习惯和定价优势),30%来自国内。截至2025年3月,可灵AI全球用户超2200万, 为超1万家企业提供API服务。 4. 增长驱动与收入预测:高增长可期。 核心增长驱动包括:全球专业内容创作者数量增长(预计年增 10%)、可灵MAU渗透率持续提升(预计从2024E的5%升至2030E的30%)、付费率提升(从2024E的 1.5%升至2030E的5%)、以及中短期ARPPU(单付费用户平均收入)的提升趋势。基于此,预计2025- 2030年可灵收入CAGR达44.7%。 5. 估值增量:36-48亿美元。 参考同业估值(如Runway在2024年12月ARR 8400万美元对应30-40亿美元 估值,PS 36-48x),考虑到可灵评测排名、流量表现、商业规模均优于Runway,中信证券保守给予可 灵36-48x PS(基于当前ARR 1亿美元),对应估值增量约36-48亿美元。 智 ...
聚焦多模态:ChatGPT时刻未到,2025大模型“变慢”了吗
Bei Jing Shang Bao· 2025-06-08 13:27
以ChatGPT为代表的语言类大模型重塑内容生成方式时,多模态模型还在等待它的"iPhone时刻"。近日召开的2025智源大会上,智源研究院(以下简称"智 源")正式发布了包括原生多模态世界模型Emu3等"悟界"大模型系列,Emu3实现了文本、图像、视频的任何组合理解与生成,通过单一模型就可以捕捉世 界的规律。 AI发展之快,每年都有新话题,2024年,价格战是大模型的关键词,2025感到风向变了,大模型应用百花齐放,反而有种大模型发展"变慢"了的体感。 事实上,市场上新旧产品同台竞技,呈现出立体、多维度的思考,多模态大模型更是如此。按照当前技术成熟度评估,视频生成等核心能力仍处于GPT-2到 GPT-3的过渡阶段,与产业预期存在显著差距。多模态模型将经历更长的技术沉淀期,这也意味着更大的想象力空间。 技术路线未收敛 大模型爆发至今,很多时候无外乎是选对了方向,又懂得流量密码,一个现象级产品就横空出世了。事实上,这种选择需要前期足够多的思考、实践和勇 气。 严格来说,Emu3是智源2024年10月发布的多模态模型,目前智源已在训练下一个版本。基于Emu3,智源还官宣了全球首个脑科学多模态通用基础模型见微 Br ...
赛道Hyper | PixVerse国内版上线:AI视频市场生变?
Hua Er Jie Jian Wen· 2025-06-08 02:32
所谓SE(3)等变网络,是一种在三维空间中,具有旋转和平移等变性质的神经网络,能自动学习对旋 转和平移等变的特征表示,从而在各种三维相关的任务中取得更好的性能。 作者:周源/华尔街见闻 全球用户量领先的AI视频生成平台——PixVerse,于6月6日推出国内版产品"拍我AI",同步上线网页端 及移动端应用,并开放最新V4.5模型供用户使用。 V4.5模型在生成速度、画面精细度及多主体控制等方面实现了提升。 首先是专业运镜系统,集成20余种电影镜头模板(如希区柯克变焦和一镜到底等),通过深度学习分析 经典电影镜头运动轨迹,实现AI自动化的专业运镜。 用户可调节焦距变化速度(0.1-10倍速)、镜头抖动幅度(0-5 级模拟斯坦尼康效果)等参数,生成具 有电影质感的动态画面。 其次,多模态融合技术,支持最多8张图片输入,通过SE(3)等变网络,实现多图像空间关系解算, 结合Transformer的时序注意力机制保证画面连贯性,自动生成包含起承转合的20秒完整片段。 通俗点说,SE(3)等变网络的工具价值就是:给它"看"一个玩具汽车3D模型,正着放、倒着放、挪到 左边右边,这个网络都能明白这是同一辆玩具汽车,还能自动 ...
全球圈粉6000万,被国内粉丝催着上线,PixVerse「国内版」一手实测来了!
机器之心· 2025-06-07 03:59
机器之心原创 这不免令人好奇,到底是什么样的产品,让国内用户如此期盼? 直到最近,这个谜底终于揭晓。如果你是一个拥有天马行空想象力的人,你一定会被这个产品吸引 —— 什么「贝多芬变身肌肉猛男」、「AI 三巨头之世界爆照我 拍照」、「萌宠眨眼变手办」…… 只要你能想出来,爱诗科技的新产品统统能帮你实现。 这个新产品名叫「 拍我 AI 」,是已经在全球用户中打出名气的视频生成应用「PixVerse」的国内版,目前已经在各大应用商店上线,网页端还提供深度体验。 在上手试了一下之后,我们发现「拍我 AI」可玩度很高。即使完全不会写提示词,你也不会觉得无聊,因为它有 上百种 模板 。只要点击「做同款」,然后替换 一下图片就可以了。所以,如果你最近在社交媒体上刷到一些很火的 AI 视频,但又不知道怎么做,去「拍我 AI」网页端翻翻,有很大的几率找到同款。 作者:张倩 恭喜国内视频创作者!从此,大家又多了一个好用的 AI 视频生成工具。 「你们的产品到底什么时候在国内上线?」 最近,爱诗科技也体验了一把小说作者的待遇 —— 打开后台,发现私信全是「催上线」的信息。 当然,如果你是专业玩家,「拍我 AI」可玩的就不止模板了。 ...
爱诗王长虎、谢旭璋:“不会创业” 的创始人,怎么做出用户量第一的 AI 视频产品
晚点LatePost· 2025-06-06 11:05
王长虎 爱诗科技创始人兼 CEO 谢旭璋 爱诗科技联合创始人 解锁 AI 视频的病毒传播后,爱诗推出 PixVerse 中国版 "拍我 AI"。 文 丨 王与桐 编辑 丨 程曼祺 "不够年轻。"2023 年初,我们第一次和投资人聊到正在筹备创业的王长虎时,这是对方的第一反应。 一种观点是,35 岁以下的创始人更适合大模型创业,不管是做模型还是应用——模型技术迭代快,年 轻人学得更快;而做应用要洞察用户,AI 的早鸟用户就是年轻人。 可偏偏,在数家视频生成创业公司被收购或关停时,是 80 后的王长虎,搭配联创 90 后谢旭璋,带着 既做模型,也做应用的爱诗科技跑到了行业头部。 爱诗的全球用户现在已超过 6000 万,是可灵当前用户数的近 3 倍; 其中,上线刚 6 个多月的 PixVerse 移动端月活已超过 1600 万。 可灵、MiniMax 海螺、Pika、Runway 等产品主要服务专业视频制作者,爱诗则在有相近功能的网页 端产品之外,也做了面向 to C 用户的视频生成移动端产品,玩法又潮、又简单: 借助 "模版",用户上传照片、等上几秒后,就可以把任何人物封装成一个小玩具,平地入海、变身美 人鱼,让 ...