Workflow
DriveVGGT
icon
Search documents
共一分享!复旦DriveVGGT:面向自动驾驶,高效实现多相机4D重建
自动驾驶之心· 2026-01-20 00:39
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 很荣幸自动驾驶之心邀请到本文作者 刘彦淏,为大家分享这篇工作。今晚七点半,锁定自动驾驶之心直播间~ 论文标题 : DriveVGGT: Visual Geometry Transformer for Autonomous Driving 论文链接 : https://arxiv.org/abs/2511.22264 分享介绍 >>直播和内容获取转到 → 自动驾驶之心知识星球 点击按钮预约直播 前馈重建技术近年来备受关注,其中视觉几何Transformer(VGGT)是典型代表。然而,由于VGGT的设计初衷与自动驾 驶任务的先验知识存在本质差异,将其直接应用于自动驾驶(AD)系统会导致次优结果。在自动驾驶场景中,需重点考 量三类关键新先验:(i) 相机视图重叠度极低 ——自动驾驶传感器配置的核心目标是以低成本实现360度全场景覆盖; (ii) 相机内参与外参已知 ——这不仅为输出结果提供了更多约束,更使得绝对尺度估计成为可能;(iii) 相对位置固 定 ——尽管自车处于运动状态,所有车载相机的相对位置始终保持不 ...
复旦最新一篇DriveVGGT:面向自动驾驶,高效实现多相机4D重建
自动驾驶之心· 2025-12-17 00:03
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Xiaosong Jia等 编辑 | 自动驾驶之心 自动驾驶中的4D场景重建是实现环境感知与运动规划的关键环节,然而传统视觉几何模型在多相机、低重叠的自动驾驶场景中往往表现不佳。 来自上海交大、复旦等机构的研究者提出 DriveVGGT,一种专为自动驾驶设计的视觉几何Transformer,通过显式引入相机相对位姿先验,显著提升了多相机系统的几 何预测一致性与推理效率。 更多自动驾驶的行业信息、技术进展,欢迎加入自动驾驶之心知识星球获取! 背景介绍 4D重建是一项从视觉传感器预测几何信息的计算机视觉任务。与其他传感器相比,基于相机的重建因其低成本而在各个领域,尤其是在自动驾驶和机器人学中,得到 了广泛的研究和应用。通常,重建方法有两种类型。第一种是基于迭代的方法,例如。这些方法需要选择特定的场景或物体,并通过迭代重建来获得优化结果。然 而,由于泛化能力不足,当场景或物体发生变化或修改时,基于迭代的方法需要重新训练模型。第二种是前向方法。这些方法 ...