深入感知级别图像理解:UniPercept 统一图像美学、质量与结构纹理感知
机器之心·2026-01-08 02:06
近日,来自上海人工智能实验室、中科大、北大、清华等机构的研究者联合发布了 UniPercept 。这是首个统一了 美学(Aesthetics) 、 质 量 (Quality) 、 结构与纹理(Structure & Texture) 三个维度的感知级图像理解框架。 操铄 :中国科学技术大学与上海人工智能实验室联合培养博士生,专注多模态图像理解与生成。主导研发了 ArtiMuse、UniPercept 等成果,多篇工作发 表于 ECCV、ICCV 等国际顶级会议。 李佳阳 :北京大学硕士生,专注多模态图像理解及融合。作为核心作者参与了 ArtiMuse、UniPercept 等工作,多篇工作发表于 TIP、TPAMI 等国际顶级 期刊。 尽管多模态大语言模型(MLLMs)在识别「图中有什么」这一语义层面上取得了巨大进步,但在理解「图像看起来怎么样」这一感知层面上仍显乏力。 UniPercept-Bench: 项目主页: https://thunderbolt215.github.io/Unipercept-project/ 代码仓库: https://github.com/thunderbolt215/UniP ...