P图新手福音!智能修图Agent一句话精准调用200+专业工具,腾讯混元&厦大出品
JarvisEvo团队 投稿 量子位 | 公众号 QbitAI 下面就来了解一下详细情况吧~ 自我评估和修正 研究背景与动机 近年来,基于指令的图像编辑模型虽然取得了显著进展,但在追求"专业级"修图体验时,仍面临两大核心挑战: 1. 指令幻觉 (Instruction Hallucination): 现有的文本思维链 (Text-only CoT) 存在信息瓶颈。模型在推理过程中"看不见"中间的修图结果,仅凭文本"脑补"假设进行下一步操作的 视觉结果,容易导致事实性错误,无法确保每一步都符合用户意图。 一句话让照片变大片,比专业软件简单、比AI修图更可控! 腾讯混元携手厦门大学推出 JarvisEvo ——一个统一的图像编辑智能体模拟人类专家设计师,通过 迭代编辑、视觉感知、自我评估和自我反 思 来"p图"。 "像专家一样思考,像工匠一样打磨" 。JarvisEvo不仅能用Lightroom修图,更能"看见"修图后的变化,并自我评判好坏,从而实现无需外部 奖励的自我进化 。 2. 奖励黑客 (Reward Hacking): 在强化学习进行偏好对齐的过程中,策略模型(Policy)是动态更新的,而奖励模型(R ...