Workflow
美学指导大模型Venus
icon
Search documents
不会拍照有招了!北大彭宇新团队开源首个美学指导大模型Venus,帮你拍好照|CVPR 2026
量子位· 2026-03-15 04:38
Venus团队 投稿 量子位 | 公众号 QbitAI 你随手拍下一张照片, AI 也许只会夸"真好看",却说不出一句真正有用的建议。 面对构图失衡、主体模糊的照片,现有大模型往往停留在泛泛而谈的"赞美式反馈"上:既识别不了问题出在哪里,也无法给出具体、可操作的 拍摄指导。 针对这一挑战,北京大学彭宇新教授团队在美学理解领域开展了最新研究,定义了 美学指导 这一任务,并构建了首个美学指导数据集 AesGuide 。该数据集包含超过一万张照片,以及与之配套的专业分析和拍摄建议。在此基础上,团队进一步提出美学指导大模型 Venus , 通过渐进式审美问答与思维链裁剪推理赋予大模型美学理解能力,使 AI 从"被动描述图像"迈向"主动指导拍摄"。 相关论文已被 CVPR 2026 接收,并已开源。 △ 图1. 美学指导任务示意图 从"图像描述"到"摄影指导" 智能手机的普及使拍照融入日常生活中,成为人们留存记忆、分享生活、记录情绪的便捷方式。但"拍得到"不等于"拍得好",由于缺乏专业的 摄影经验与审美训练,许多用户在构图布局、取景视角与人景关系等关键环节难以做出准确判断,导致照片无法拍好,在质感与表现力上与专 业摄影 ...