Workflow
等了大半年的Qwen3-VL终于也开源了!
自动驾驶之心·2025-09-24 06:35

以下文章来源于刘聪NLP ,作者刘聪NLP 刘聪NLP . 不会rap的刘聪,在这里分享着AI的flow。 作者 | 刘聪NLP 来源 | 刘聪NLP 抓着云栖大会,猛开源是吧,两天时间,开源了Qwen3-Omni系列模型、Qwen-Image-Edit-2509模型、 Qwen3-VL模型、Qwen3Guard-Gen系列模型,共计12个。 还有一些没开源的API,比如Qwen-TTS、Qwen3-Coder-Plus、Qwen3-Max、Qwen3-LiveTranslate等等等 PS: 我恨俊旸呀!天天凌晨开源~ 说实话,根本测不完,都知道我一直在等Qwen3的VL模型,其他模型先放一放,今天先来测试一波VL模 型。 先来看看模型相关内容,Qwen3-VL相较于Qwen2.5-VL有以下方面改进, vision encoder部分 ,Qwen3-VL沿用之前的VisionPatchEmbed,使用Conv3d,不过patch_size从14扩到了 16,激活函数从silu变成gelu_pytorch_tanh projector部分 ,从之前的MLP-based Projector,额外增加DeepS ...