ViMoGen
Search documents
从过拟合到通用!ViMoGen开启3D人体动作生成新纪元
机器之心· 2026-01-07 09:30
随着 AIGC(Artificial Intelligence Generated Content) 的爆发,我们已经习惯了像 Sora 或 Wan 这样的视频生成模型能够理解「一只宇航员在火星后空翻」这样天 马行空的指令。然而,3D 人体动作生成(3D MoGen)领域却稍显滞后。 现有的模型在标准数据集上表现良好,但在泛化能力上仍存在明显瓶颈。一旦用户输入训练集中未见过的复杂交互或罕见动作,生成的动作往往会缺乏自然性、 崩坏或退化为简单的平均姿态,这严重限制了其在现实场景和交互系统中的应用。 那很自然地就会思考: 视频生成模型已经初步学会了通用的物理规律和人类行为,为什么不把这些知识「蒸馏」给 3D 人体动作生成模型呢? 论文链接:https://arxiv.org/abs/2510.26794 项目主页:https://linjing7.github.io/vimogen/ ViGen-to-MoGen 的三大支柱 来自 南洋理工大学、商汤科技、清华大学、香港中文大学和英伟达的研究人员 提出了题为 《The Quest for Generalizable Motion Generation: Data, ...