Vidu Q3
Search documents
国产之光Vidu Q3加冕新王!全球首个16秒音视频直出模型,超越Sora领跑AI视频下半场
Sou Hu Wang· 2026-02-02 02:57
刚刚过去的2025年,AI 视频行业正在经历一场深刻变革——从"生成玩具",演进为真正的"内容生产力 工具"。在这一过程中,生数科技的 Vidu 系列模型持续推动行业能力边界的前移。 从早期的视频生成,到 Vidu Q2 实现"演技生成" 的关键跃迁,再到 Vidu Agent"一键成片",打通完整工 作流,AI 视频的创作门槛持续降低。 今天,这场演进迎来新的里程碑:Vidu Q3正式发布。这是一款以「为剧而生」为核心理念打造的新一 代模型,也是全球首个支持 16 秒音视频直出的 AI 视频模型。 在国际权威AI基准测试机构Artificial Analysis 最新公布的榜单中,Vidu Q3 排名中国第一,全球第二, 超越 Runway Gen-4.5 ,Google Veo3.1和 OpenAI Sora 2。Vidu 正用实力让世界看清"中国速度",领跑视 频生成的下半场。 | Artificial A Analysis | Models v | Speech, Image, Video - Hardware Leaderboards - Al Trends | | Arenas v Article ...
大模型持续迭代 Vidu推出全球首个支持16秒音视频直出模型Q3
Zheng Quan Ri Bao Wang· 2026-02-01 09:57
本报讯 (记者贾丽)刚刚过去的2025年,人工智能视频行业正在经历一场深刻变革——从"生成玩 具",演进为真正的"内容生产力工具"。在这一过程中,北京生数科技有限公司(以下简称"生数科 技")推出的Vidu系列模型持续推动行业能力边界的前移。 从早期的视频生成,到Vidu Q2实现"演技生成"的关键跃迁,再到Vidu Agent"一键成片",打通完整工作 流,AI视频的创作门槛持续降低。 近日,Vidu Q3模型正式发布。这是一款新一代模型,也是全球首个支持16秒音视频直出的AI视频模 型。 国际权威AI基准测试机构Artificial Analysis最新公布的榜单显示,Vidu Q3排名中国第一,全球第二,超 越Runway Gen-4.5,Google Veo3.1和OpenAI Sora 2。业内人士认为,Vidu正用实力让世界看清"中国速 度",领跑视频生成的下半场。 在生数科技相关负责人看来,这次发布的意义,并不只是"视频变长了",而是一个关键拐点的到来—— AI视频第一次可以作为"可直接使用的叙事内容单元",进入内容生产的全链条。 长期以来,行业一直在讨论一个核心问题,AI能不能成为内容生产链条 ...
挪威主权财富基金2025年获利近2500亿美元;理想新设人形机器人和软件本体部门;Sora下载量暴跌45%丨邦早报
创业邦· 2026-01-31 01:12
【 Sora 下载量暴跌 45% 】 人工智能应用的早期热潮似乎退却。据 Appfigures 数据显示, OpenAI 开发的 AI 视频生成应用 Sora 的移动端下载量 1 月环比下跌 45% ,消费者环比支出则下 降 32% 至 36.7 万美元。 Sora 在去年 10 月曾一度登顶苹果应用商店的下载量榜首,并比 ChatGPT 更早达成了百万次下载量目标,但现在,其用户群正在以惊人的速度流失。近两个月, Sora 表现出明显的疲态, 12 月下载量环比下跌了 32% ,而假日季通常意味着移动设备使用量的 高峰期。这一下滑可能与版权限制以及谷歌 Gemini 的竞争加剧有关。(财联社) 【理想新设人形机器人和软件本体部门,多数自动驾驶员工划入基座模型团队】 理想汽车将完成一系 列研发体系组织架构及人事调整: 新成立软件本体团队,由智能空间副总裁勾晓菲任负责人; 新成 完整早报音频,请点击标题下方小耳机收听 立人形机器人团队,由自动驾驶研发高级副总裁郎咸朋任负责人; 由詹锟任基座模型团队负责人,多 数自动驾驶部门员工划入该团队; 原自动驾驶部门下设的 AI 评测与运营部门负责人湛逸飞、数据标 注部门负 ...
马斯克还在卷10秒,中国AI直接掀桌!16秒一镜到底,全球唯一
Sou Hu Cai Jing· 2026-01-30 11:04
新智元报道 编辑:桃子 定慧 【新智元导读】硅谷巨头在AI视频赛道激战正酣,中国AI正面硬刚!今天,Vidu Q3震撼登场,16s音画直出一镜到底,正式开启「视听生成」时代。 2026年的AI视频圈,开局即决战! 硅谷巨头们的贴身肉搏,比想象中来得更早,也更猛烈。 几周前,谷歌Veo 3.1凭借「素材生视频」(Ingredients to Video),超强一致性+4K画质惊艳登场。 坊间传闻Veo 3.2也将蓄势待发 另一边,马斯克也来秀肌肉了。Grok Imagine上线生成10s视频的功能,音画双飞跃。 Runway全新Gen 4.5模型,死磕连贯叙事、高一致性,同样生成时长可达10s。 就在这硝烟弥漫的时刻,中国AI队正式加入战局,并向全球牌桌投下了一枚重磅炸弹。 下一代旗舰模型——Vidu Q3,今日重磅登场! 它带着极具野心的Slogan:「声画同出,创想无界」,直接重新改变了游戏规则。 这是全球首个一键直出16s音视频的模型,做到了一次生成,完整表达。 这意味着,在长达16秒的时长里,Q3能同时处理画面、声音、剧情推进、镜头调度,叙事能力更强。 更惊艳的是,它还支持镜头控制+自由切换、多语言文字 ...
这个真人版《火影忍者》竟然是AI做的,来自中国AI视频新王者Vidu Q3
量子位· 2026-01-30 11:02
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 开年第一个月,国产AI真的是卷没边儿了。 这不,AI视频生成圈又新鲜出炉了个大的—— 全球首个支持一口气生成 16秒音视频 直出的AI! 然后啊,我反手就做一个 真人版《火影忍者》 第四次忍界大战的名场面,请欣赏: 如何?是不是从画面到台词再到音效,都有原版日漫的那个味道了? 而制作这部 真人剧 背后的模型,正是生数科技新鲜出炉的 Vidu Q3 。 在体验一番下来,最大的感受就是 全自动 : 在语言上,这次Vidu Q3还同时支持中文、英文和日文等多种。 有点意思,着实有点意思。 而且Vidu Q3这次的实力也是得到了国际权威AI基准测试机构Artificial Analysis的认证。 在最新的榜单中,Vidu Q3 排名 中国第一,全球第二 ;与之同台竞技的选手包括马斯克xAI Grok,超越Runway Gen-4.5、Google Veo3.1和OpenAI Sora 2。 视频和音频是一次性一锅出的 运镜和转场是自由切换一步到位的 文字和图片都能生成音视频的 清晰度是支持1080P的(生成后可提升至4K) 叙事能力是完整的、文字渲染是精准的 | ...