Workflow
基于Qwen3-VL的自动驾驶场景实测
自动驾驶之心·2025-11-22 02:01

点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 近年来,多模态大模型在自动驾驶领域的潜力逐渐显现。它们能否真正"看懂"路况、理解交通行为、甚至预测 风险,成为行业内外关注的焦点。 笔者对近期阿里通义最新的 Qwen3-VL 模型进行了一系列自动驾驶场景的实测,涵盖 场景理解、空间推理、 行为判断、风险预测 等多个维度。 个人认为, Qwen3-VL不仅在基础感知任务上表现稳健,更在开放式推理与动态场景理解中展现出令人惊喜 的"老司机"潜质 。 更重要的是, 它并未经过专门的自动驾驶指令微调(SFT) ,却能对复杂交通场景做出合理、连贯、甚至带 有"安全意识"的判断——这让我们看到了通用视觉语言模型在垂直领域中落地的更多可能。 本次测试选取了 CoVLA 基准中的部分图像,以及基准中的一些中翻后的问题。此外笔者也自拟了一些开放式 问题。 一起来看看吧!更多关于自动驾驶的技术解析、行业动态和业内交流, 欢迎加入自动驾驶之心知识星球,超过4000的人自驾社区...... 场景理解和空间推理 示例1 :简单描述一下这张图片。 :图片中的天气如何? :车辆正行驶在哪 ...