Workflow
Driving Gaussian Grounded Transformer (DGGT)
icon
Search documents
AI Day直播!免位姿前馈4D自动驾驶世界DGGT
自动驾驶之心· 2025-12-23 00:53
论文标题 : DGGT:Feedforward 4D Reconstruction of Dynamic Driving Scenes using Unposed Images 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>直播和内容获取转到 → 自动驾驶之心知识星球 点击按钮预约直播 自动驾驶的训练与评估需要快速、可扩展的4D重建与重新仿真能力,然而现有大多数针对动态驾驶场景的方法仍依赖于 逐场景优化、已知相机标定或短时间窗口,导致速度缓慢、实用性受限。 本文从前馈视角重新审视该问题,提出了 Driving Gaussian Grounded Transformer(DGGT) ,一个统一的、无需位姿 的动态场景重建框架。本文注意到,现有方法通常将相机位姿作为必需输入,限制了灵活性与可扩展性。相反,本文将 位姿重新定义为模型的输出,从而能够直接从稀疏、无位姿的图像进行重建,并支持长序列中任意数量的视角。该方法 联合预测每帧的3D高斯图与相机参数,通过轻量级动态头解耦动态元素,并利用寿命头调制随时间变化的可见性以保持 时序一致性。 此外,基于扩散的渲 ...