JarvisEvo
Search documents
P图新手福音,智能修图Agent一句话精准调用200+专业工具,腾讯混元&厦大出品
3 6 Ke· 2025-12-26 07:11
一句话让照片变大片,比专业软件简单、比AI修图更可控! 腾讯混元携手厦门大学推出JarvisEvo——一个统一的图像编辑智能体模拟人类专家设计师,通过迭代编辑、视觉感知、自我评估和自我反思来"p图"。 现有的文本思维链 (Text-only CoT) 存在信息瓶颈。模型在推理过程中"看不见"中间的修图结果,仅凭文本"脑补"假设进行下一步操作的视觉结果,容易导 致事实性错误,无法确保每一步都符合用户意图。 1. 奖励黑客 (Reward Hacking): 在强化学习进行偏好对齐的过程中,策略模型(Policy)是动态更新的,而奖励模型(Reward Model)通常是静态的。这导致策略模型容易"钻空子",通 过欺骗奖励函数获取高分,而非真正提升修图质量和自我评估能力 。 为了解决上述问题,团队推出了JarvisEvo. "像专家一样思考,像工匠一样打磨"。JarvisEvo不仅能用Lightroom修图,更能"看见"修图后的变化,并自我评判好坏,从而实现无需外部奖励的自我进 化 。 下面就来了解一下详细情况吧~ 自我评估和修正 研究背景与动机 近年来,基于指令的图像编辑模型虽然取得了显著进展,但在追求"专业级 ...
P图新手福音!智能修图Agent一句话精准调用200+专业工具,腾讯混元&厦大出品
量子位· 2025-12-26 04:24
JarvisEvo团队 投稿 量子位 | 公众号 QbitAI 下面就来了解一下详细情况吧~ 自我评估和修正 研究背景与动机 近年来,基于指令的图像编辑模型虽然取得了显著进展,但在追求"专业级"修图体验时,仍面临两大核心挑战: 1. 指令幻觉 (Instruction Hallucination): 现有的文本思维链 (Text-only CoT) 存在信息瓶颈。模型在推理过程中"看不见"中间的修图结果,仅凭文本"脑补"假设进行下一步操作的 视觉结果,容易导致事实性错误,无法确保每一步都符合用户意图。 一句话让照片变大片,比专业软件简单、比AI修图更可控! 腾讯混元携手厦门大学推出 JarvisEvo ——一个统一的图像编辑智能体模拟人类专家设计师,通过 迭代编辑、视觉感知、自我评估和自我反 思 来"p图"。 "像专家一样思考,像工匠一样打磨" 。JarvisEvo不仅能用Lightroom修图,更能"看见"修图后的变化,并自我评判好坏,从而实现无需外部 奖励的自我进化 。 2. 奖励黑客 (Reward Hacking): 在强化学习进行偏好对齐的过程中,策略模型(Policy)是动态更新的,而奖励模型(R ...
拒绝「盲修」:JarvisEvo 如何让 Agent 像人类一样拥有「视觉反思」能力?
机器之心· 2025-12-24 03:41
此外,在传统强化学习中经常依赖于静态的奖励模型。随着模型的不断训练,它很容易学会如何「讨好」这个固定的打分器,导致 Reward Hacking —— 即分数很高,但审美并没有真正提升。 为了打破这一僵局, JarvisEvo 应运而生。它不仅仅是一个连接 Adobe Lightroom 的自动化工具使用者,更是一次大胆的探索:探索 Agent 如何通过 「内省」,真正实现自我进化。 在迈向通用人工智能的道路上,我们一直在思考一个问题: 现有的 Image Editing Agent,真的「懂」修图吗? 大多数基于 LLM/VLM 的智能体,本质上更像是一个「盲目的指挥官」。它们能流利地写出修图代码或调用 API,但在按下回车键之前,它们看不见画布 上的变化,也无法像人类设计师那样,盯着屏幕皱眉说:「这张对比度拉太高了,得往回收到一点。」这种感知与决策的割裂,直接导致了「指令幻觉」, 或者说模型在进行盲目的「脑补」。由于缺乏视觉反馈,模型往往凭空想象下一步操作,导致结果与用户的初衷南辕北辙。 核心范式转移: 论文标题: JarvisEvo: Towards a Self-Evolving Photo Edit ...