拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
前者无需多言,它现在也能像"连续剧"一样生成各种精准符合指令的图片: 一水 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 一上手就令网友直呼「生图能力」比GPT-4o更强?! 就在昨夜,阿里带着全新 多模态模型Qwen-VLo 开启炸场模式。 据介绍,Qwen-VLo在阿里原有的多模态理解和生成能力上进行了全面升级,具备三大亮点: 而且无论是输入端还是输出端,Qwen-VLo都 支持任意分辨率和长宽比,不受固定格式的限制 。 同时在官方释出的demo中,除了那些GPT-4o已经有的玩法 (如连续生成、吉卜力风格、添加文字) ,它还支持一些脑洞大开的idea。 至于后者,比如我们像在超市选购日用品一样,让Qwen-VLo生成一张 "洗浴用品都在购物篮里" 的图片。 结果啪的一下,还真立马完成装货了(⊙ˍ⊙): 不是没有一些小瑕疵,但有一说一,其 "理解"能力 确实比之前更强。 官方介绍,这种理解能力不止体现在图像生成上,还包括对图像的识别解释。 具有增强的 细节捕捉能力 ,能在整个生成过程中保持高度语义一致性; 一个指令即可实现图像编辑,包括风格替换、素材增删、添加文字等等; 支持中英等多语言,全球用户 ...