清华大学人工智能研究院朱军:视频生成不会出现“DeepSeek时刻”
21世纪经济报道记者白杨 北京报道 "我判断,视频生成领域大概率不会出现像DeepSeek这种靠效率实现遥遥领先的模型"。在近日召开的 2025中关村论坛年会期间,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军向21世 纪经济报道记者表示。 他这样判断的依据是,在视频生成领域,大家已经将DeepSeek主打的效率进行实践,并且在很多产品 中都有体现。 "因此我不认为会在某一个时刻,突然出现一个换代式的或比别人都强很多倍的产品出现"。朱军说道。 当下,朱军还在等待视频模型的"ChatGPT时刻"。在他看来,这需要视频模型真正实现更好用和更可 控,"只有这样,视频模型才能真正达到人人可用的状态。" 朱军表示,与此前Vidu 2.0是追求效率和性价比不同,Vidu Q1更强调的是质量。Vidu Q1通过接收空间 布局信息作为输入,极大提升了视频模型的可控性,尤其是在多主体细节可控、音效同步可控 、画质 增强方面均取得成效。 以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1可以对场景中多 主体的位置、大小、运动轨迹等属性进行更进一步的可控,以及对所有动作行为(出场、退场 ...