NeurIPS'25 Oral:何必DiT,字节首次拿着自回归,单GPU一分钟生成5秒720p视频
3 6 Ke·2025-11-14 08:35
一篇入围顶会NeurIPS'25 Oral的论文,狠狠反击了一把DiT(Diffusion Transformer)。 毕竟自打DiT问世以来,视频生成这块,算是被它给稳稳拿捏住了。 但站稳了脚跟,并不意味着没有问题,因为它的计算复杂度高,在资源消耗和速度上有着诸多挑战。 而这篇来自字节跳动商业化技术团队的论文,则是提出了一个名叫InfinityStar的方法,一举兼得了视频生成的质量和效率,为视频生成方法探索更多可 能的路径。 像下面这些有趣的动画片片段,便是由InfinityStar亲手打造: 整体来看InfinityStar的亮点,我们可以总结为如下三点: 是首个在VBench上超越扩散模型的离散自回归视频生成器; 视频生成不用再"慢慢熬":从百步去噪到自回归,告别延迟; 1. 任务通吃:文生图、文生视频、图生视频、交互式长视频生成等。 值得一提的是,InfinityStar目前的论文、代码、体验地址均已经发布(链接见文末),接下来我们就进一步实测一波~ 啪!~~~ 实测给DiT上了一课的AI视频生成 首先我们来简单了解一下InfinityStar的体验方法。 它的入口就在Discord社区里面,大家登 ...