生数科技CEO骆怡航:从模型到生产,多模态AI如何推动视频创作更高效
硬AI·2025-06-09 14:07
北京生数科技有限公司首席执行官骆怡航发表了主题演讲——"多模态生成:从模型走向生产",主要围绕 多模态大模型,特别是视频生成在产业落地中的机遇、挑战,并分享了生数科技(Vidu)的解决方案和成 果。 以下是演讲亮点: 多模态大模型迎来规模化生产落地的拐点:第一,我们看到技术迭代非常迅速,音视频的生成模型无论在 效果、速度、成本上都快速提升。其次,行业需求特别旺盛。第三,很多行业视频内容相关的各种产业落 地节奏加快。 今年包括再往后要同时具备四个条件:内容的创意,内容质量、生成的效率和生产的成本。 如果具备了内容的质量好于传统方式,同时生产效率和生产成本,在我看来效率必须比传统的方式要至少 百倍的提升。 对于生数科技来讲,我们聚焦在多模态生成,现在主要以视频生成为主,包括音视频的部分,未来我们会 延展到3D叙事空间等等。目前我们聚焦在专业的用户和企业用户,致力于把模型推动到8大行业、30大场景 里面。 Vidu 2.0把速度极大做了提升,可以达到 5 秒技术生成。同时Vidu Q1 进一步提升,包括高清的版本,还有 首尾帧,还有动漫等方向。同时对于音效还有音频我们做了深化。 从Vidu上线以来,专业创作的占比增 ...