传媒:视频生成模型再迎突破
Huajin Securities·2024-02-18 16:00
2024年02月18日 行业研究●证券研究报告 传媒 行业快报 视频生成模型再迎突破 领先大市-A维持 投资评级 投资要点 首选股票 评级 事件: 2月16日OpenAI 发布文生视频模型Sora,其使用 Transformer 架 构,建立在DALL·E3和GPT模型之上,可以生成长达一分钟的有运动、多机 一年行业表现 位视频。相比业界水平,Sora将视频生成的时长一次性提升了15倍,直接迈 过了市面上所有短视频的时长要求。 视频生成模型范式的确定有望进一步推动多模态模型发展。模型层面:在文生 视频领域,目前模型思路有循环网络(RNN)、生成对抗网络(GAN)和扩 散模型(Diffusionmodels),Sora为一种扩散模型相较于 GAN,扩散模型 的生成多样性和训练稳定性都要更好。生成表现:扩散模型在图片和视频生成 上有更高的天花板,GAN模型从原理上本质上是机器对人的模仿,而扩散模型 则更像是机器学会“成为一个人”。Sora基本框架:基于OpenAI大语言模型 思路, Sora采用Transformer架构( 主流视频生成扩散模型较多采用 U-Net 架构 ),同时开发视频压缩网络有效减小 Tr ...