从平面几何出发:形式化验证如何驱动MLLM的推理能力跃迁
机器之心·2026-01-20 10:19

在迈向通用人工智能(AGI)的征途中,多模态大语言模型(MLLMs)虽然在视觉理解与文本生成上展现了惊人的能力,却始终面临一道难以逾越的鸿沟:如何 在复杂的数学与几何推理中,克服固有的幻觉与逻辑断层? 现有的 "结果导向" 训练往往掩盖了推理过程的脆弱性,导致模型常常 "蒙对答案" 却 "想错过程"。这 种 "黑盒" 式的学习方式,使得模型难以习得真正鲁棒的推理能力。 面对这一挑战,来自 上海 交通大学 、 复旦大学、香港 中文大学(深圳)、上海人工智能实验室等研究机构的团队 提出了一套全新的系统化解决方案: "Formal Enhance Informal Reasoning"(以形式化增强非形式化推理)。 该方案的核心洞察在于:利用领域内(In-Domain)极度严谨、可验证的形式化逻辑,可以作为一 种强有力的监督信号,去规范和引导模型在非形式化场景下的推理行为。 更进一步,研究发现这种在严谨数学环境中习得的逻辑素养,不仅仅局限于几何题,更 能作为一把通用的钥匙,解锁模型在通用数学乃至更广泛推理任务上的分布外(OOD)泛化能力。 基于这一理念,团队历经三个阶段的探索,构建了从数据底层到模型顶层的完整闭环: ...

从平面几何出发:形式化验证如何驱动MLLM的推理能力跃迁 - Reportify