ArtEdit数据集
Search documents
P图新手福音,智能修图Agent一句话精准调用200+专业工具,腾讯混元&厦大出品
3 6 Ke· 2025-12-26 07:11
一句话让照片变大片,比专业软件简单、比AI修图更可控! 腾讯混元携手厦门大学推出JarvisEvo——一个统一的图像编辑智能体模拟人类专家设计师,通过迭代编辑、视觉感知、自我评估和自我反思来"p图"。 现有的文本思维链 (Text-only CoT) 存在信息瓶颈。模型在推理过程中"看不见"中间的修图结果,仅凭文本"脑补"假设进行下一步操作的视觉结果,容易导 致事实性错误,无法确保每一步都符合用户意图。 1. 奖励黑客 (Reward Hacking): 在强化学习进行偏好对齐的过程中,策略模型(Policy)是动态更新的,而奖励模型(Reward Model)通常是静态的。这导致策略模型容易"钻空子",通 过欺骗奖励函数获取高分,而非真正提升修图质量和自我评估能力 。 为了解决上述问题,团队推出了JarvisEvo. "像专家一样思考,像工匠一样打磨"。JarvisEvo不仅能用Lightroom修图,更能"看见"修图后的变化,并自我评判好坏,从而实现无需外部奖励的自我进 化 。 下面就来了解一下详细情况吧~ 自我评估和修正 研究背景与动机 近年来,基于指令的图像编辑模型虽然取得了显著进展,但在追求"专业级 ...