AI视频生成

Search documents
AI视频生成新品实测:这怎么不算影院级呢?
量子位· 2025-08-25 15:47
不圆 发自 凹非寺 量子位 | 公众号 QbitAI 百度最新视频生成模型 蒸汽机2.0 (MuseSteamer 2.0),好像真的有点东西。 这是在网上热传的一段由它生成的视频,可以说是要声音有声音,要画面有画面,不说的话还以为是某部重生剧的先导片。 AI配音的中文非常自然,和角色口型也对得很好。 我们也试着生成了一个小视频,仅用1张图片和1段提示词,就做出了这样的效果: 仔细听,这只猫甚至会呼噜噜,远处还有虫子叫。 网友评价:这简直像魔法一样! 它要怎么用才会更好玩?又能用来做什么呢? 我们实测了这款模型,一起来看它的具体表现。 模型表现 该说不说,作为全球首个 中文 音视频一体化生成的I2V模型,蒸汽机模型在中文语音的表现上可以说是手拿把攥,但这是蒸汽机1.0模型刚出 的时候就已经介绍的东西。 作为升级版本,蒸汽机2.0更加擅长 复杂运镜 ,用镜头讲故事的能力也更强,画质进一步提升。 让我们看看,作为普通人能用这个模型实现什么想法? 它的表现 和爆火的Veo3相比 ,哪个更好呢? 画画人狂喜:绘画转视频 我们让豆包生成了一张手绘风格的图片,画面上是一只大野兔蹲在草丛里。 就假装它是我们画出来的吧 (手 ...
首个接入GPT-5的视频Agent!一句话生成商业级广告大片,分镜配音字幕等全包了
量子位· 2025-08-25 02:32
AI视频生成,快速进入Agent时代! 只需一句提示词: 生成一个F1赛车的现场解说视频 。 AI即可自动完成分镜、画面、配音、字幕,生成结构完整、节奏在线的爆款视频。 小明 发自 凹非寺 量子位 | 公众号 QbitAI 自小范围开放邀请码以来,它迅速在X、Reddit、YouTube等平台刷屏。 这次引发大家关注的主要原因,是应用层面交互方式的更新。 直接把编剧、导演、演员、摄影、音效、后期等多条战线的活儿都干了! 或者是 制作商业广告大片 。 真实还原现实世界画面,从食物到人物动作,都极致逼真,香飘诱人的感觉立马就来了! 以上效果,都是由 Video Ocean 制作而来,它是 全球首个接入GPT-5 的视频Agent。 它让原本几个星期才能制作完成的精美视频,缩短至只需 数天甚至数分钟 。 不同于传统AI视频只能生成 单个镜头片段 、或依赖模板去填充画面,Video Ocean从产品设计上直接改变了创作协作模式:目标不再是"更 快产出一个镜头"或"套用固定模板",而是 更快交付一个完整的创意项目 。 具体效果如何,一起来看—— 接入GPT-5,自动化创作生态系统 作为 全球首个接入GPT-5 的视频A ...
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
量子位· 2025-08-24 01:13
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 就在刚刚, 马斯克 一手 开源动作 ,引发了大伙儿的高度关注—— xAI现在正式开源Grok 2.5,Grok 3将在半年后开源。 其实早在本月初的时候,马斯克就公开表示过: 是时候开源Grok了,将会在下周。 虽然开源的时间已经超过了他说的节点,但也正如网友所说: 迟到总比没有的好。 42个文件,500个G 目前,Grok已经可以在 HuggingFace 中下载(链接附文末): | xAI官方建议 | 用SGLang来运行 | Grok 2,具体步骤如下。 | | | --- | --- | --- | --- | | 第一步, | 下载权重文件 | 。 | | | /local/grok-2 换成任何你喜欢的文件夹名字: | 你可以把 | | | | hf download xai-org/grok-2 —local-dir /local/grok-2 | | | | | 官方表示,这个下载过程中可能会遇到一些错误,如果出错了,可以多试几次直到下载成功。 | | | | | 42个文件 | 500GB 。 | 下载成功后,文件夹里应该有 | ,大小约 ...
百度蒸汽机2.0发布:成本降至七成,AIGC视频将进入普惠时代
Cai Jing Wang· 2025-08-23 11:09
AI视频生成正成为大模型竞争的核心战场,成本与质量的平衡逐渐成为行业比拼的关键。 8月21日,百度在"热AI大会"上发布蒸汽机2.0,Turbo、Lite、Pro及有声版同步上线。新版本在语音与 画面同步、多角色对话生成、中文场景适配等方面进行了升级,并将定价大幅下调,刊例价相比同类产 品下降至70%,让好莱坞百万级特效成本降至"百元"。 据百度副总裁、移动生态商业体系负责人陈一凡透露,降本背后是百度长期在GPU算力架构和工程优化 上的积累。"自2016年起,商业研发团队就率先在搜索广告场景中引入GPU,形成了软硬件结合的技术 路径。本次蒸汽机迭代,依托百度智能云'百舸'平台与自研昆仑芯片,与策略工程架构和底层算力结 合,推理效率和算力利用率得到大幅提升,从而支撑了价格下探。" 在国内外厂商加速迭代视频生成应用的背景下,百度蒸汽机选择以"技术突破+价格下行"同时发力,意 在撬动更大规模的创作者和商业市场。 技术突破与产品升级:从"一体化"到"可用性" 相比文字和图像生成,视频生成的难点在于多模态的统一:画面要连续自然,声音要真实可信,更重要 的是口型、表情、动作与语音节奏要完全对得上。百度商业研发首席架构师李 ...
百元造出科幻大片?AI视频生成“钱景”初显
Bei Jing Ri Bao Ke Hu Duan· 2025-08-23 01:12
用300多元的成本,就能制作一部科幻短片?过去需要一整支团队才能完成的视频制作,如今只需要一张图、一句话,就能生成电影级质感的视频。AI 视频生成技术正以惊人的速度走向规模化应用,引发互联网巨头、初创企业的激烈竞逐。 "密码0821,快去重启,消灭他们。""收到!"当男主角接到指令,历尽艰难输入重启控制台的密码,在暗无天日如同世界末日般的场景下,给人类带来 巨大威胁的异形生物在瞬间崩成了碎粒、消失不见……8月21日,曾参与《2012》《黑客帝国3》《变形金刚3》等多部好莱坞大片及国产科幻剧《三 体》视效工作的国际知名视效指导姚骐展示了一段自己用AI制作的2分钟科幻短片《归途》。 数百元做出影视级短片 姚骐创作《归途》所用的AI工具是来自北京的视频大模型。当天,百度"蒸汽机"(MuseSteamer)音视频一体化模型在发布不到50天后宣布重大升级。 与业界大量AI生成视频大多为"默片"不同,"蒸汽机"在行业内首次实现多人有声音视频一体化生成。百度商业体系商业研发总经理刘林告诉记者,使用 百度"蒸汽机"音视频一体模型制作的《归途》,整体成本仅330.6元人民币。而姚骐表示,如果这部短片是一部纯实拍的片子,成本可能 ...
可灵 2.1 首尾帧藏师傅外挂教程:两张图→大片,附万能提示词
歸藏的AI工具箱· 2025-08-22 09:10
Core Viewpoint - The article emphasizes the capabilities of the Keling 2.1 model in generating first and last frame videos, particularly focusing on image generation and prompt creation, which are crucial for producing high-quality content [1][7]. Summary by Sections Image Acquisition Methods - Three primary methods for obtaining suitable images for first and last frame video generation are discussed: same prompt card drawing, modified prompt card drawing, and using image editing models like FLUX Kontext [8]. - Using the same prompt for card drawing often yields highly similar images, making it ideal for showcase-type videos [9]. - Modifying prompt card drawing allows for the movement or disappearance of main characters or objects by changing parts of the prompt after generating the initial image [12]. - Image editing models enable precise control over images through natural language, allowing for various effects to be added [15]. Prompt Generation for First and Last Frame Videos - The prompts used for generating first and last frame videos are entirely AI-generated, leveraging the enhanced understanding and adherence capabilities of the Keling 2.1 model [27]. - A structured approach to prompt creation is outlined, focusing on analyzing differences between the starting and ending frames and selecting appropriate transition strategies [28][29]. - The article details how to construct specific changes in the visuals, including object transformations, environmental changes, and stylistic variations [37]. Value Creation and Narrative Enhancement - The article suggests that the true value lies in solidifying the process into a template for future projects, enhancing productivity significantly [39]. - It emphasizes the importance of elevating effects into narratives, transforming the approach from mere visual transitions to storytelling, which can significantly increase the perceived value of the videos produced [41].
可灵2.1首尾帧功能上线 破解AI视频转场难题
Huan Qiu Wang· 2025-08-22 08:41
Core Insights - The article discusses the launch of the new 2.1 model by Keling AI, which features an upgraded head-and-tail frame function that significantly enhances video generation capabilities, achieving a 235% improvement compared to the previous 1.6 version [1][10]. Group 1: Key Features of the 2.1 Model - The core improvement of the Keling 2.1 model is the enhancement of transition performance, allowing for natural scene connections and eliminating common issues like abrupt scene changes [2]. - The visual presentation has been enhanced, enabling the creation of visually striking effects, as demonstrated in test videos where complex visual elements are clearly rendered [4][6]. - The model supports professional-level camera movements, achieving smooth transitions that enhance viewer immersion, as illustrated by a video featuring a robot in an explosive scene [6]. Group 2: Marketing and Cost Efficiency - The upgraded head-and-tail frame function aids in quickly generating creative display videos that align with brand tones, which is beneficial for marketing and reduces material production costs [8]. - A specific example from a beverage advertisement showcases the model's ability to create immersive experiences, with dynamic visuals of a can bursting from raspberries [10]. Group 3: Performance Evaluation - Professional assessments indicate that Keling 2.1 outperforms other models, achieving a GSB score of 2.09 against Seedance 1.0 mini and 2.30 against Midjourney, with a 62% and 57% win rate in preference comparisons [10]. - The model's performance is attributed to its end-to-end optimized multi-modal semantic reasoning capabilities, which integrate user prompts with visual semantics and action intentions [12]. Group 4: Industry Impact - Keling AI has completed 30 iterations of its platform, serving over 45 million users and generating over 200 million videos and 400 million images across various industries, including advertising, film, and gaming [12]. - The introduction of the 2.1 model further solidifies Keling AI's position in the AI video generation sector, enhancing consistency and stability in video production for creative applications [12].
破解AI视频转场难题 可灵2.1最强首尾帧上线
Zheng Quan Shi Bao Wang· 2025-08-22 04:49
8月22日,可灵AI正式发布基于2.1模型的全新首尾帧功能,其效果较1.6模型提升235%,在视频转场、 视觉冲击力、复杂运镜及创意营销等维度表现卓越。专业评测显示,其整体GSB得分全面超越 Midjourney与Seedance1.0mini。可灵2.1首尾帧的推出,进一步提升了AI视频生成的可控性,广泛适用于 广告营销、影视、短剧、动画等创意制作场景。 ...
可灵2.1最强首尾帧上线 生成效果提升235%
Zhi Tong Cai Jing· 2025-08-22 04:45
智通财经获悉,8月22日,可灵AI正式发布基于2.1模型的全新首尾帧功能,其效果较1.6模型提升 235%,在视频转场、视觉冲击力、复杂运镜及创意营销等维度表现卓越。专业评测显示,其整体GSB 得分全面超越Midjourney与Seedance1.0mini。可灵2.1首尾帧的推出,进一步提升了AI视频生成的可控 性,广泛适用于广告营销、影视、短剧、动画等创意制作场景。 ...
好莱坞特效师花300多块钱,用AI做了一部科幻短片
第一财经· 2025-08-21 16:02
2025.08. 21 本文字数:1767,阅读时长大约3分钟 作者 | 第一财经 刘佳 参与过电影《2012》、《黑客帝国3》等好莱坞大片的视效指导姚骐今天公布了他用AI制作的科幻短片《归途》。 短片里,如同末日的世界里,巨大的异形生物追击驾驶汽车的人类、巨型蜘蛛爬在高楼等场景栩栩如生。姚骐评价"(效果)跟实拍差不多。" 他向第一财经等记者透露,整部短片用了40多个镜头,每个镜头生成3次,共计120个视频片段,其中包括18个10秒一体化的有声片段和102 个五秒片段,最终花费约一周时间制作完成。 姚骐说,如果这部短片是一部纯实拍或者CG制作的片子,可能需要几百万的成本。在好莱坞做镜头,有些复杂的镜头仅一个就要几十万甚至 上百万。此外,实拍还受限于场景实现难度、危险性以及演员、剧组成本,而AI技术的介入为创意实现提供了全新可能。 几百万实拍成本的短片,如果用AI生成,花费是多少? 姚骐AI短片的合作对象、百度商业体系商业研发总经理刘林告诉记者,该片使用百度蒸汽机音视频一体模型,整体成本约在330.6元人民币。 当然,AI生成的视频还不够完美。记者整体观看下来,例如短片生成的人类"AI味儿"浓,演技和人类演员相 ...