Workflow
中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考
机器之心·2025-05-29 07:10

在人类的认知过程中,视觉思维(Visual Thinking)扮演着不可替代的核心角色,这一现象贯穿于各个专业领域和日常生活的方方面面。 生物化学家在探索新的治疗途径时,会在脑海中构建蛋白质的三维立体结构,通过视觉化的分子间相互作用来理解复杂的生化过程;法医分析师在破解疑难 案件时,需要在心中重建犯罪现场的空间布局,通过视觉推理来验证证据之间的逻辑连接;建筑师在设计创新建筑时,会在脑海中不断勾勒和修正建筑草 图,通过视觉想象来优化空间配置和光照效果;篮球运动员在制定战术策略时,需要在脑海中构想队友的跑位路线、防守阵型的变化以及关键时刻的战术配 合,通过视觉化的场景想象来设计最佳的进攻方案;在日常决策中, 一般人也会通过「脑补」各种可能的场景图像来辅助判断和选择,用脑海中自发生成 的图像作为认知媒介。 这种视觉思维能力的独特之处在于,它能够创造概念间的独特组合和新颖连接,帮助我们发现仅通过纯文本推理无法获得的洞察和创意。而在现代认知科学 中,这种「深思熟虑」往往需要多模态的思维过程来支撑。 如今,AI 也迈出了这一步:上海交通大学、上海创智学院、复旦大学和 Generative AI Research Lab( ...