Workflow
L4 Motion Forecasting数据集
icon
Search documents
自动驾驶论文速递 | 多模态大模型、运动规划、场景理解等~
自动驾驶之心· 2025-07-13 08:10
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 MCAM:面向自车层面驾驶视频理解的多模态因果分析模型 重庆大学&国防科技大ICCV25中稿的工作,本文提出 MCAM 模型,通过 DSDAG 因果图建模自车状态动 态演化,在BDD-X数据集上将驾驶行为描述任务BLEU-4提升至 35.7%,推理任务BLEU-4提升至 9.1%,显 著优于DriveGPT4等基线模型。 主要贡献: 算法框架: 实验结果: 论文标题:MCAM: Multimodal Causal Analysis Model for Ego-Vehicle-Level Driving Video Understanding 论文链接:https://arxiv.org/abs/2507.06072 代码:https://github.com/SixCorePeach/MCAM 1. 提出驾驶状态有向无环图(DSDAG),用于建模动态驾驶交互和状态转换,为因果分析模块(CAM) 提供结构化理论基础。 2. 提出多模态因果分析模型(MCAM),这是首个针对 ego-vehicle 级驾驶视频理解 ...