越狱成功率飙升至87.6%,南京大学联合美团、上交破解主流视频生成模型安全漏洞
机器之心·2025-12-25 05:26

RunawayEvil 创新性采用「策略 - 战术 - 行动」核心范式,精准破解传统单一模态、静态攻击在 I2V 场景下效果受限的行业痛点,为 I2V 模型的安全漏洞分析提供 了高效可靠的工具,为构建更稳健、安全的视频生成系统提供助力。 来自南京大学 PRLab 的王淞平、钱儒凡,在单彩峰教授与吕月明助理教授的联合指导下,提出首个面向图生视频(I2V)模型的多模态自进化越狱攻击框架 RunawayEvil。本研究联合了美团、上海交通大学等多家顶尖机构,共同完成了首个支持多模态协同与自主进化的 I2V 越狱攻击框架的研发。 行业痛点: 图生视频模型安全研究的三大核心缺口 图生视频(I2V)是融合图像视觉约束与文本语义引导,生成时空连贯、高保真动态内容的核心多模态技术,为内容创作、商业广告等领域提供高效创意支撑。然 而,其安全防护体系是脆弱的,尚未跟上技术落地步伐,成为制约行业稳健发展的关键瓶颈。 论文标题:RunawayEvil: Jailbreaking the Image-to-Video Generative Models 项目地址:https://xzxg001.github.io/RunawayEvi ...

越狱成功率飙升至87.6%,南京大学联合美团、上交破解主流视频生成模型安全漏洞 - Reportify