Workflow
美团视频生成模型来了!一出手就是开源SOTA
量子位·2025-10-27 05:37

一水 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 美团,你是跨界上瘾了是吧!(doge) 没错,最新开源SOTA视频模型,又是来自这家"送外卖"的公司。 模型名为 LongCat-Video ,参数13.6B,支持文生/图生视频,视频时长可达数分钟。 从官方释出的demo来看,模型生成的视频不仅更加真实自然,而且懂物理的能力又双叒增强了。 无论是空中滑板: 还是一秒特效变身: 抑或是第一视角下,全程需要保持画面一致的骑车视频 (时长整整有4分多种) : 仔细看,视频的AI味儿浓度确实降低不少。 而且从测评成绩来看,其表现也相当亮眼——文生视频能力在开源模型中处于顶尖水平,整体质量优于PixVerse-V5和Wan2.2-T2V-A14B, 部分核心维度甚至可与谷歌最新、最强闭源模型Veo3媲美。 而且由于采用的是允许商用的 MIT协议 ,连Hugging Face高级主管也用三连问来表示惊叹。 中国团队竟然发布了一个MIT协议的基础视频模型??? 以及其长视频生成能力 (稳定输出5分钟) 也被视为,"我们离视频AI的终极形态又更进一步"。 so,一家外卖公司出品的视频模型究竟如何?来看更多案例。 文 ...