AI视频生成

Search documents
实测Vidu Q1参考生功能,看到诸葛亮丘吉尔拿破仑在长城拍照留念
机器之心· 2025-07-11 08:27
机器之心报道 看到这里,大概就可以看出 Vidu Q1 参考生功能的不寻常之处了。 编辑:Youli 这次真的不一样,遇到了「想象力的神」! 以前常说「要把自己活成一支队伍」,如今感谢 AI,真的实现了。 最近,生数科技旗下 AI 视频模型 Vidu Q1 推出参考生功能,极大简化传统内容生产流程,真正实现「一个人就是一个剧组」! 首先,我们来看一个视频: 这几个人物形象大家应该都很熟悉。 摇着羽扇、说着「想不到世间还有如此厚颜无耻之人」出现在各大鬼畜视频中的诸葛亮,英国铁血首相丘吉尔,以及战绩可查的拿破仑,如今他们跨越时空,围 坐在会议室中密切交谈,实现「世纪大会晤」! 如果用常规的 AI 图生视频来做的话,一般要经过写脚本、文生图 / P 图 / 融图、图片生成、图生视频、成片等步骤,但实际上,这里只用了三张图片和 Vidu Q1 的 参考生功能! 就像把大象放进冰箱只需要三步一样,这里也只需要三个步骤:找到上传照片、写提示词、成片。 更炫技的操作是,X 网友 Alex,她是一名艺术家兼程序员,在她的操作下,1989 年版本的蝙蝠侠与 1993 年版的侏罗纪公园霸王龙,不仅同框出现,还上演激烈 「对打」, ...
视频模型赛道“热闹”起来了,但变现仍不容易
Di Yi Cai Jing· 2025-07-05 08:19
视频大模型行业暂时不会出现一家独大的局面。 近一个月的视频模型产品更新之前,Sora的热度已带动一批新品面世。包括2024年上半年的爱诗科技PixVerse、Runway Gen-3、Luma Dream Machine,下半 年的生数科技Vidu、智谱清影、字节跳动PixelDance、MiniMax海螺等。 一方面,视频模型你追我赶。据AGI-Eval(上海交通大学、同济大学等高校和机构合作发布的大模型评测社区),2024年12月,PixVerse-V3、可灵1.5、 Video-01的得分(评测维度包括视频-文本一致性、视频质量、运动质量等)超越Sora。 但同时,受限于技术成熟度、商业化、成本高等因素,视频模型的创业热度并不及AI应用层,主要由大型互联网/科技企业组成,由爱诗科技、生数科技、 Pika、Runway、MiniMax等明星创业公司补充。 此前,MiniMax创始人闫俊杰表示,视频类工作复杂度比文本更难,上下文文本很长,一个5秒的视频就有几M(兆字节,MB)大小,但文本领域,5秒看 100个字的大小可能都不到1K(千字节,KB),这是几千倍的存储差距。该差距带来的挑战便是如果通过基本文本构 ...
1080p飞升4k,浙大开源原生超高清视频生成方案,突破AI视频生成清晰度上限
量子位· 2025-07-01 03:51
为什么AI生成的视频总是模糊卡顿?为什么细节纹理经不起放大?为什么动作描述总与画面错位? 其中一个重要原因在于,现有的开源千万级视频数据集分辨率基本低于1080P(1920×1080),且大部分视频的说明(caption)简单粗糙, 不利于大模型学习。 当主流视频生成模型还在720P画质挣扎时,浙江大学APRIL实验室联合多家高校推出的 高质量开源UHD-4K(其中22.4%为8K)文本到视频 数据集——UltraVideo ,破解了这一困局。 浙大APRIL实验室团队 投稿 量子位 | 公众号 QbitAI 该数据集涵盖广泛主题(超过100种),每个视频配备9个结构化字幕及一个总结性字幕(平均824词)。 作为全球首个开源4K/8K超高清视频数据集, UltraVideo 配合结构化语义描述框架,让视频生成实现从"勉强能看"到"影院级质感"的跨越式 进化。 团队基于42K精选视频微调的UltraWan-4K模型,实现三大突破: 方法:四阶过滤打造高质量4K视频数据集 当前视频生成面临两大瓶颈: 分辨率陷阱 :模型在低清数据训练后,直接生成4K视频会出现严重失真。如图2所示,naïve Wan-T2V-1.3 ...
AI穿越直播视频为啥这么火(有事说事)
Ren Min Ri Bao Hai Wai Ban· 2025-06-30 02:06
现在是公元208年。这里最长的成之战 this is 208 adjthe battle of Chengban Slope AI视频生成技术正成为连接古今、沟通中外的崭新纽带,让尘封的历史记忆焕发出新的活力,也让文 化的交流更加生动可及。 如果陈子昂活在今天,或许不需要怆然涕下了——近日,"AI穿越直播"火了。 视频中,AI记者"穿越"至古代场景:或在烽火连天的赤壁战场奔走解说,或"现身"唐朝玄武门之变现 场,或"参与"秦朝长城修筑……这样的作品如雨后春笋般涌现,凭借"第一人称Vlog视角+历史名场 面"的独特叙事,营造出强烈的"在场感",让观众在虚实交融中沉浸式感受历史的鲜活脉搏。 A n xx _ 我现在就在泰国会战的核心现场! I'm right in the heart of the battle of Red Cliffs 技术是把双刃剑,热闹之下也有隐忧。如果说,网上冒出一些让人哭笑不得的内容,比如"秦始皇直播 卖瓷砖""屈原代言粽子",将历史娱乐化,还能让人一眼看破、一笑置之的话,有些AI作品把不同历史 时期的东西凑在一起,却又"一本正经"地讲述,则有可能误导儿童青少年,容易将AI生成的"历史 ...
AI视频大战升级:Sora“神话”被打破?国产模型加速商业化落地
Hua Xia Shi Bao· 2025-06-28 12:01
从东方美学到赛博朋克,从黏土动画到三维写实,《新世界加载中》在不同画风的切换中,开启了全新 的AIGC微短剧叙事。《新世界加载中》是由快手可灵AI与星芒短剧联合出品、由异类Outliers团队制作 的全球首部AI单元故事集,已经在6月26日上线。 多模态大模型带动诸多行业重塑生产环节,由于短剧篇幅较短、市场规模处于快速增长期,且AI生成 能有效降低科幻等题材的特效成本,其成为AIGC最先落地的影视内容。在《新世界加载中》总导演、 异类Outliers创始人陈翔宇看来,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性 释放。 2024年开始,一个个视频大模型接踵登场,并在此后不断升级优化,试图抢占竞争高地。而随着AI行 业回归理性,越来越多的企业意识到大模型的商业化落地颇为重要。"可灵AI是一个商业化的产品,确 实有一些商业化目标,但从市场化来看,我们商业化的这些数字更多还是去印证市场和用户需求的可能 性,此刻我们单纯说数字没有什么意义,因为行业还在比较早期阶段,更希望和创作者一起共同探索和 摸索。"可灵AI产品及运营负责人李杨在6月25日接受《华夏时报》记者在内的媒体记者采访时表示。 据记者了 ...
AI应用系列报告:AI视频生成:商业化加速,国产厂商表现亮眼
Guoyuan Securities· 2025-06-27 05:13
传媒行业 投资评级 推荐 维持 AI视频生成:商业化加速,国产厂商表现亮眼 ——AI应用系列报告 证券研究报告 2025年6月27日 证券分析师: 李典 邮箱: lidian@gyzq.com.cn SAC执业资格证书编码:S0020516080001 联系人: 郜子娴 邮箱:gaozixian@gyzq.com.cn 报告要点 请务必阅读正文之后的免责条款部分 2 技术路径:从GAN-Transformer-Diffusion Model-DiT,技术演进推动行业进入可商用阶段:20世纪90年代以来,AI视频生成持续迭 代,经历了多个关键技术的突破,经历了从静态图像序列拼接成视频流-GAN-Transformer-Diffusion Model-DiT的技术演进,生成内容 丰富度以及可控性持续提升。Sora验证了Diffusion和Transformer结合的有效性,并带动DiT架构逐渐成为当前重点方向。 行业进入商业化发展快轨,根据Fortune Business Insights预计2032年全球规模突破184亿人民币。根据Fortune Business Insights 测算,2024年AI视频生成 ...
所有爆款 AI 视频一键生成?Hailuo Video Agent 体验
歸藏的AI工具箱· 2025-06-20 08:45
大家好,这里是歸藏(guizang),今天带来新鲜出炉的 Hailuo Video Agent 体验。 前几天我就说随着视频生成模型成本的提高和提示词遵循效果变好,成熟的视频生成 Agent 应该马上就会出 现了。 没想到 MiniMax 先做了 ,他们将会分阶段打造 Hailuo Video Agent。 这个路径是非常务实而正确的,刚好前几天 Andrej Karpathy 也分享了类似的观点,应该先做半自动的钢铁 侠战甲组件,最后做完全自主的机器人。 我们应该专注于构建"钢铁侠战甲"(增强工具),而不是"钢铁侠机器人"(完全自主Agent) 这些产品应 具备自定义 GUI 和用户体验,以加速人类的生成-验证循环,同时仍提供自主性滑块,允许产品随时间变 得更加自主。 刚好今天他们开放了第一个阶段的 Agent 使用权限,我试用了一下。 打磨的非常好,选择你喜欢的模板,点"做同款"就行, 门槛超级低,基本上传图片完事了,真正的有手就 行。 模板覆盖了你能想到的所有AI 视频出圈玩法, 不管是外国山海经还是人像动态写真还是产品广告视频,你能 想到的品类这里都能找到。 然后再来个电商场景吧,产品展示类型的视频应 ...
嚯!国产视频模型的物理水准超神了 | 实测MiniMax海螺02
量子位· 2025-06-19 06:25
鱼羊 一水 发自 凹非寺 量子位 | 公众号 QbitAI 满场观众瞩目之下,体操运动员稳稳完成一个跳步动作,然后……突然来了段木上芭蕾??? 这可不是什么网球王子排球少年真人版之类的运动电影特技—— 要知道,前段时间让谷歌出尽了风头的Veo 3,都还在这一挑战面前翻了车,让网友直呼: 体操就是视频生成模型的图灵测试。 新模型名叫Hailuo 02,主打一个"超清画质"、"精准响应": 原生支持1080p,可以hold住 极端复杂的物理场景 。 不仅是体操,搞点城市特技也是信手拈来,并且连玻璃里的倒影都符合真实世界的客观规律。 以上画面, 完全由AI生成 。 没错,这一次 MiniMax视频生成模型上新 ,还真是把"体操"这个AI视频生成的亘古难题给搞定了! △ 图源:@WuxiaRocks 总而言之就是:物理表现有点太强了吧。 如此水准,使得Hailuo 02深夜发布即炸场,海内外网友抹平时差第一时间纷纷玩嗨。 不少网友直言:比Veo 3更好。 值得一提的是,Hailuo 02一发布,也直接冲上了AI视频竞技场图生视频排行榜第二名,在基准测试中超越当红炸子鸡Veo 3。 | | Text to Video ...
AI生图之王首发视频大模型,每月10刀,最长20秒,效果超逼真
3 6 Ke· 2025-06-19 03:23
智东西6月19日报道,今日凌晨,AI图像生成顶流Midjourney发布其首款AI视频生成模型V1。 V1支持用户上传Midjourney生成的或外部图像进行视频生成,有手动、自动生成动作提示词两个选项,可设置镜头移动更快的高速运动和相对静止的低速 运动。 从其生成效果来看,V1可以保证在画面背景变化的同时,主人公动作行为依旧连贯且流畅,即使凭空创造的怪物、科幻形象运动也流畅自然。 用户在Midjourney图像生成界面选项点击"Animate Image"就可以体验,最长可生成20秒视频。 目前,Midjourney的所有订阅者都可以体验V1,其会员起订费为10美元(折合人民币约71.9元)/月,用户每次生成视频需从每月预设的信用额度中扣除点 数,类似"按次消耗额度"的机制。Midjourney正在测试为每月60美元订阅费的会员开放"无限制轻松模式"。 Perplexity AI设计师Phi Hoang在X上评价:它超出了我所有的预期。 Phi Hoang在X上评价 V1的发布也意味着Midjourney开启了从图像生成走向全多媒体内容创作的重大转变。不过,相比于视频生成赛道的老玩家,V1的功能并不完善,其 ...