又一国产图像大模型开源,实测连续P图绝了,中文渲染是短板
3 6 Ke·2025-12-08 10:47
智东西12月8日报道,今日,美团正式发布并开源图像生成模型LongCat-Image,这是一款在图像编辑能力上达到开源SOTA水准的6B参数模 型,重点瞄准文生图与单图编辑两大核心场景。 ▲图源:Hugging Face 从官方披露的基准测试结果来看,LongCat-Image主要对标了Seedream4.0、Qwen-Image、HunyuanImage-3.0、Nano Banana以及FLUX.1-dev等 主流开源与闭源生图模型,其核心优化集中在"编辑可控性"和"中文文字渲染"两项能力上。 而在实际体验中,它在连续改图、风格变化和材质细节上表现较好,但在复杂排版场景下,中文文字渲染仍存在不稳定的情况。在涉及复杂 UI设计、游戏界面生成等任务时,模型的审美也暴露出一定短板,这或许与其不具备联网搜索能力有关。 在体验入口方面,美团也同步提供了多种使用方式。在移动端,LongCat APP已支持文生图与图生图能力;在网页端,用户也可通过 https://longcat.ai/进入图片生成入口进行体验。 对于开发者而言,LongCat-Image的模型权重与代码也已同步开源: Hugging Face: ht ...