Snapchat提出Canvas-to-Image:一张画布集成 ID、姿态与布局
机器之心·2025-12-09 03:17

Canvas-to-Image 是一个面向组合式图像创作的全新框架。它取消了传统「分散控制」的流程,将身份参考图、空间布局、姿态线稿等不同类型的控制信 息全部整合在同一个画布中。用户在画布上放置或绘制的内容,会被模型直接解释为生成指令,简化了图像生成过程中的控制流程。 作者 :Yusuf Dalva, Guocheng Gordon Qian*, Maya Goldenberg, Tsai-Shien Chen, Kfir Aberman, Sergey Tulyakov, Pinar Yanardag, Kuan-Chieh Jackson Wang 通讯作者 :Guocheng Gordon Qian 机构 :¹Snap Inc. ²UC Merced ³Virginia Tech 论文标题 :Canvas-to-Image: Compositional Image Generation with Multimodal Controls 项目主页 : https://snap-research.github.io/canvas-to-image/ arXiv :arxiv.org/abs/2511.216 ...