地平线&清华Epona:自回归式世界端到端模型~
自动驾驶之心·2025-08-12 23:33
作者 | 蔡道清 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1932480841222723066 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 作者阵容挺强的,代码也开源了,值得follow。 Motivation 自动驾驶世界模型需同时满足长时程高分辨率场景生成与实时精准轨迹规划,但现有方法存在明显局限: 因而,本文提出一个 既能生成长时高分辨率视频,又能端到端输出连续轨迹 的统一框架。 Contribution Paper link : https://arxiv.org/pdf/2506.24113 Code link : https://github.com/Kevin-thu/Epona 扩散模型(如Vista):固定长度视频生成(≤15秒),无法支持灵活长时预测(>2分钟)和多模态轨迹控制; GPT式自回归模型(如GAIA-1):可无限延伸,却需把图像 离散成 token ,导致视觉质量下降,且缺乏连 ...