AI视频生成

Search documents
腾讯开源的HunyuanVideo-Avatar上传一张图+一段音频,虚拟角色“活”过来
Sou Hu Cai Jing· 2025-06-04 02:48
今天早上,GitHub上突然冒出一个让AI圈炸锅的项目——腾讯开源的HunyuanVideo-Avatar。 这是一个开源的视频生成工具,上传一张图+一段音频,就能让图中的人物、动物甚至虚拟角色"活"过来,开口说话、唱歌、演相声! 连爱因斯坦和奥黛丽·赫本都能被AI"复活"同台说相声,这类工具其实之前就有,那腾讯这次开源的HunyuanVideo-Avatar有什么魅力呢,一起来看看? 一、你的照片会"演戏" HunyuanVideo-Avatar的核心逻辑就像个"数字人导演",它能从一张静态图中读懂场景,再根据音频的情感让角色动起来。而这一切的秘密武器,藏在三个 模块里: 1、告别AI生成的"网红脸"! 传统模型容易生成"千人一面"的角色,而腾讯用这个模块直接把你的照片"刻"进模型里。能精准保留原图细节,连衣服褶皱和背景光影都保持一致。 3、多人飙戏不串场! 看Demo,视频中两个角色的唇形、表情、手势完全独立,连互动时的眼神交流都自然得像真人演员。 二、创意可以成真 HunyuanVideo-Avatar可以在这些场景应用: 电商直播:上传商品图+促销文案,AI主播24小时在线带货,还能根据"限时秒杀"的 ...
腾讯混元推出AI数字人技术:一张照片配音频即可生成唱歌视频
Feng Huang Wang· 2025-05-28 09:23
官方表示,HunyuanVideo-Avatar在主体一致性和音画同步准确度方面已达到业内领先水平,超越现有 开源和闭源解决方案。在画面动态性和肢体自然度表现上,与其他主流闭源方案处于同等技术水准。 目前,HunyuanVideo-Avatar的单主体功能已在腾讯混元官方网站开放体验,用户可通过"模型广场-混元 生视频-数字人-语音驱动"路径访问相关功能。系统当前支持不超过14秒的音频文件上传,后续将逐步 开源更多高级功能模块。 腾讯此次开源举措将推动AI视频生成技术的普及应用,为短视频创作、电商营销、广告制作等垂直领 域提供低成本的技术解决方案。 凤凰网科技讯 5月28日,腾讯混元团队联合腾讯音乐天琴实验室正式发布并开源语音数字人模型 HunyuanVideo-Avatar。该技术仅需用户提供一张人物图像和一段音频文件,即可自动生成包含自然表 情、精准唇形同步以及全身动作的动态视频内容。 HunyuanVideo-Avatar基于腾讯混元视频大模型与MuseV技术深度融合开发。该模型具备强大的多模态理 解能力,能够自动识别输入图像中的人物环境信息以及音频所承载的情感内容,进而生成高度匹配的视 频片段。以实际 ...
诺瓦星云(301589) - 2025年5月20日投资者关系活动记录表
2025-05-20 12:05
证券代码:301589 证券简称:诺瓦星云 西安诺瓦星云科技股份有限公司 投资者关系活动记录表 编号:2025-001 | | □特定对象调研 □分析师会议 | | --- | --- | | 投资者关系 | ☑业绩说明会 □媒体采访 | | 活动类别 | □新闻发布会 □路演活动 | | | □现场参观 | | | □其他 (请文字说明其他活动内容) | | 参与单位名称 | 投资者网上提问 | | 及人员姓名 | | | 时间 | 年 月 日(周二)下午 2025 5 20 15:00~17:00 | | 地点 | 公司通过全景网"投资者关系互动平台"(https://ir.p5w.net)采用网 | | | 络远程的方式召开业绩说明会 | | 上市公司 | 董事、副总经理、董事会秘书:翁京 | | 接待人员姓名 | 财务总监:张争 | | | 证券事务代表:刘朋 投资者提出的问题及公司回复情况 | | | 公司就投资者在本次说明会中提出的问题进行了回复: | | | 1、公司产品是否可以应用到新能源汽车内的显示屏上? | | 投资者关系活 | 尊敬的投资者,您好!公司聚焦于视频显控核心算法研究及应 | ...
国产AI技术加速重构行业格局 快手可灵系列大模型市场份额超30%
Zheng Quan Ri Bao· 2025-05-16 16:39
从市场表现来看,可灵AI的用户规模和使用频率均呈现出快速增长趋势。自发布以来,可灵AI全球用 户规模已突破2200万,月活用户量增长25倍,累计生成超过1.68亿个视频及3.44亿张图片,特别是在4月 末发布的可灵2.0大师版,仅在3周后就在Poe平台上拿下了20.9%的份额。 此外,快手可灵的商业化进程同样跑出加速度。快手最新财报显示,今年2月份可灵AI累计营业收入已 超过1亿元;今年前3个月,可灵AI营收超过2024年总和。 一位不愿具名的行业分析师对《证券日报》记者表示,国产视频大模型发展前景广阔。技术上,生成时 长、分辨率等性能持续提升,可灵等模型已展现竞争力。应用上,影视、广告、教育等多领域加速渗 透,大幅降本增效。商业化方面,会员制等模式逐步成熟,头部企业已实现千万级月流水。随着算力成 本下降与多模态融合深化,国产视频大模型有望引领全球内容生产范式变革。 有业内人士对《证券日报》记者表示,快手可灵系列市场份额超30%,彰显其技术实力与商业化落地能 力。依托海量短视频数据优势,可灵在视频时长、分辨率等关键指标上突破,精准匹配行业需求。伴随 着生态体系完善与迭代加速,可灵有望持续领跑市场,重塑AI视频 ...
不会剪辑?一句话生成完整可编辑的视频:Medeo 带你看视频生成的未来
歸藏的AI工具箱· 2025-05-16 08:11
过去一年不断有人问我,"藏师傅有没有通过一个提示词生成整段视频的产品啊,我愿意付费"或者是"藏师 傅,我这里有口播稿和素材有没有能帮我剪辑的 AI 产品"。 我跟他们说的都是应该快了,马上就会有的,这次终于有了! Medeo( https://ai.medeo.app/create ):创作者的专属AI视频工作室。 无论你有多少素材,哪怕只有一句话,他都能帮你生成一个带口播、音乐的完整视频。 这篇内容我会用几个案例来展示这个产品有多强大,另外会介绍一些使用技巧。 先来看一些案例 最基础的能力是你提供素材或者口播稿,他会帮你完成剪辑并生成视频。 非常适合资讯类或者对内容控制要求高的需求。 而且你可以要求他严格按照你提供的口播稿生成视频,也可以提供信息之后让他自己发挥。 比如下面这个左边就是我提供了 Dia CEO 的发言之后让他自己发挥的,右边就是让他精准根据口播稿生成的 视频。 我还提供了一些 Dia 的截图和视频,如果不够的话他还会自己寻找素材匹配进去,整个成本非常低。 当别的信息搬运者还在复制文字的时候,你直接一个链接丢进去,已经出视频了。 下面这个科普视频,我整个提示词就只有这一段话,没有任何干预,所有 ...
ZPedia丨诺兰看了沉默,王家卫看了流泪:全球首款无限时长AI视频模型横空出世
Z Finance· 2025-04-21 01:56
AI拍片现状——导演看了想转行 2025年,AI视频生成工具仍然活跃在"短平快"的战场上打转。几乎所有产品都卡在一个尴尬的瓶颈: 单 视频时长还停留在10秒左右,剧情刚刚起个头,模 型已经开始喘气, 创作者们不得不通过"拼接手法"让作品续命 ;运镜效果不堪入目,像是菜刀绑在GoPro上拍的风景片;输入"悲伤逆光奔跑",AI却端出 一个毫无情绪的面瘫角色,还附赠一束奇怪的炫光特效。 当前阶段的AI视频生成技术,或许已经实现了"能生成画面"的突破,但距离"会讲故事"的境界还相去甚远。即便是一个简单的连贯动作,也需要开发者反复 调试参数;面对那些似是而非的生成结果,创作者们往往在一声"勉强能用"的叹息后,默默关闭了程序界面。 就在行业陷入技术瓶颈的胶着时刻,昆仑万维以双剑出鞘之势打破僵局:其推出的Skyreels-V2不仅成为全球首个支持无限时长的开源电影级生成模型,更 携手多主体视频生成模型Skyreels-A2,以"双引擎"架构重新定义了视频生成领域的三大核心指标——时长延展性、画面品质感、导演控制力。 Github 地址: https://github.com/SkyworkAI/SkyReels-V2 产品 ...
生数科技加速商业化:原字节跳动AI大将、火山引擎高管骆怡航加盟出任CEO
IPO早知道· 2025-03-13 05:06
AI视频生成赛道已到了技术成熟和商业化落地的关键时刻。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职, 全面负责公司研发、产品、商业化及团队管理工作。 图 生数 骆怡航博士毕业于清华大学自动化系,深耕云计算及AI领域十余年,拥有深厚的技术背景、产业生态 理解和成熟的商业化经验,还具有丰富的海外拓展经历。 在加入生数科技之前,他担任字节跳动火 山引擎AI应用产品线一号位,汇报火山引擎总裁,全权负责产品线的战略、产品和商业化。 据悉, 该条产品线由骆怡航博士从 0组建,涵盖多个传统AI、大模型及大模型应用产品,管理规模数百人, 服务全球多个行业及国家的近万家客户,该产品线当前是火山引擎的重点产品线之一,也是大模型业 务的主力产品线。更早期,他在字节跳动负责AI解决方案与商业合作,曾参与到字节跳动早期的AI中 台规划与建设,见证并推动了字节跳动在AI领域的发展。 事实上,从整个行业发展来说,骆怡航选择加入生数科技,某种程度上也意味着AI视频生成赛道已到 了技术成熟和商业化落地的关键 ...
速递|OpenAI 计划将Sora接入ChatGPT,Sora的生成能力或扩展到图像
Z Potentials· 2025-03-01 03:53
萨海说, OpenAI 正积极努力让 Sora 可以在 ChatGPT 中访问,将这两个产品结合起来 , 尽管没有透露时间。 萨海表示 , 最终进入 ChatGPT 的 Sora 版本,可能无法提供与 Sora 网络应用程序相同的控制程度, 后者允许用户编辑和拼接视频片段。 利用 Sora 视频将用户引流到 ChatGPT, 将 Sora 接 入 ChatGPT 也可能激励用户升级到 ChatGPT 的高级订阅, 这可能提供更高频率的视频生成。 正如 萨海 在办公时间解释的那样, OpenAI 推出 Sora 作为独立的 Web 应用程序的原因之一是为了维持 ChatGPT 的简单性。 图片来源: Unsplash OpenAI 打算将其 AI 视频生成工具 Sora 直接集成到其应用 ChatGPT 中, 公司在 Discord 上的周五会议上提到。 Sora 仅通过 OpenAI 在 12 月推出的专用 Web 应用程序提供 , 该应用程序允许用户访问同名的 AI 视频模型 , 以生成长达 20 秒的电影风格片段。 然而 ,OpenAI 的 Sora 产品负责人 Rohan Sahai 表示 , 该公司计 ...
爱诗科技完成近3亿元A+轮融资,核心AI视频生成产品PixVerse全球用户数超1200万
IPO早知道· 2024-12-18 03:14
持续推动AI视频生成技术普惠。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,爱诗科技日前完成A2至A4轮融资,总金额近3亿元人民币。此前,A2轮融资由 蚂蚁集团投资,近期A3、A4轮融资由北京市人工智能产业投资基金、国科投资及光源资本投资,光 源资本继续担任独家财务顾问。融资将主要用于提升技术研发能力、扩展算力资源以及建设人才团 队,加速产品功能迭代与市场覆盖,持续推动AI视频生成技术的普惠。 截至目前,爱诗科技的核心AI视频生成产品PixVerse全球用户数超1200万,月活跃用户数近600 万。 自2024年10月PixVerse V3版本发布后,"毒液变身"等创意特效功能席卷海内外社交媒体, 为亿万用户提供了前所未有的AI视频生成体验。PixVerse不仅在文生视频和图生视频能力上保持全 球领先,还上线了Video to Video(视频生视频)功能,可基于实拍视频或影视片段进行延长生 成,进一步拓宽了AI视频创作的可能性。 2024年12月,PixVerse 移动App在海外上线,可通过官网下载体验。同时,爱诗科技已面向企业 用户开放技术 ...
对话 PixVerse 王长虎:AI 视频生成可能通向新平台,Sora 只领先几个月
晚点LatePost· 2024-04-30 10:25
"抖音就是从 15 秒的视频做起来的。" 文丨王与桐 编辑丨程曼褀 今年 2 月 OpenAI 发布了由视频模型 Sora 生成的视频,时长可达 60 秒并且视频内容丝滑、连贯、 逼真。 一张梗图在 Sora 发布后流传于社交媒体:Sora 是坐在宝座上的巨大神像,下面跪着一众渺小的膜拜 者,包括 Runway、Pika、SVD、PixVerse 等十多个视频生成模型或产品。 Sora 出现后,这张梗图开始流传。 "能被放在第一排,我们很高兴。" 推出 PixVerse 的爱诗科技创始人兼 CEO 王长虎说。 PixVerse 是 "膜拜者" 中唯一一个由中国公司开发的产品,网页端产品在今年 1 月上线,根据第三方 监测平台 SimilarWeb 数据,PixVerse 3 个月内达到了超过 140 万的月访问量,去年 11 月上线的 Pika 现在是超 200 万的月访问量。 做出 PixVerse 的爱诗科技由王长虎在 2023 年 4 月创立。2017 年初 ,王长虎加入字节跳动,担任 AI Lab 视觉技术负责人。作为在微软亚洲研究院学习和工作十余年的计算机视觉专家,王长虎带领 技术团队,研发了抖音、 ...