Data Scaling Law
Search documents
解决特斯拉「监督稀疏」难题,用世界模型放大自动驾驶的Scaling Law
具身智能之心· 2025-11-20 00:03
点击下方 卡片 ,关注" 具身智能之心 "公众号 编辑丨 机器之心 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 在自动驾驶领域,VLA 大模型正从学术前沿走向产业落地的 "深水区"。近日,特斯拉(Tesla)在 ICCV 的分享中,就将其面临的核心挑战之一公之于众 —— "监 督 稀 疏" 。 这一问题直指当前 VLA 模型的 "七寸": 其输入是高维、稠密的视觉信息流,但其监督信号却往往是低维、稀疏的驾驶动作(如路径点)。那么即便使用 PB 级的 海量数据,VLA 模型的巨大潜力也无法被有效释放。 正当业界热议这一瓶颈时,一支来自国内顶尖学术机构与华为合作的团队,已经悄然给出了破解这一难题的 "锦囊"。一篇名为 《DriveVLA-W0: World Models Amplify Data Scaling Law in Autonomous Driving》 的新工作,为解决这一 "监督稀疏" 提供了极具洞见的解决方案。该研究提出, 世界模型(World Model)是 解锁 VLA 数据规模定律(D ...
解决特斯拉「监督稀疏」难题,DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law
机器之心· 2025-11-17 04:23
AXIV 传播学术,共享智能 About us Alxiv是机器之心发布学术、技术内容的栏目,在过去数年间接收并报道了数千篇内 容,覆盖了全球各大顶级学术及产业界机构,有效促进了领域内的传播、交流与合作。 如果您有优秀的工作想要分享,欢迎联系: 网 zhaoyunfeng@jiqizhixin.com 网 liyazhou@jiqizhixin.com 在自动驾驶领域,VLA 大模型正从学术前沿走向产业落地的"深水区"。近日,特斯拉(Tesla)在 ICCV 的分享中,就将其面临的核心挑战之一公之于众 —— "监 督 稀 疏"。 V 1. Curse of dimensionality Extremely large context length is a minimum requirement for driving · Input context length of 2 billion tokens: · 7 cameras x 36 FPS x 5 Mega pixels x 30s history / (5x5 pixel patch) · Navigation maps and route for ...