DALL・E

Search documents
CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化
机器之心· 2025-05-12 04:31
本文由中国科学院计算技术研究所研究团队完成,第一作者为硕士生杨晗,通讯作者为副研究员安竹林,助理研究员杨传广。 论文标题:Multi-party Collaborative Attention Control for Image Customization 论文地址:https://arxiv.org/abs/2505.01428 论文代码:https://github.com/yanghan-yh/MCA-Ctrl 背景 近年来,生成式人工智能(Generative AI)技术的突破性进展,特别是文本到图像 T2I 生成模型的快速发展,已经使 AI 系统能够根据用户输入的文本提示 (prompt)生成高度逼真的图像。从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型,这一领域的技术迭代呈现出加速发展的态势。 在基础 T2I 模型能力不断提升的背景下,图像定制化(Image Customization)需求日益凸显。所谓图像定制化,是指在对参考图像中的主体(subject)保持身份特 征和本质属性的前提下,根据文本或视觉条件生成该主体的新表现形式。这一技术对于电子商务( ...