从平面几何出发：形式化验证如何驱动MLLM的推理能力跃迁

在迈向通用人工智能（AGI）的征途中，多模态大语言模型（MLLMs）虽然在视觉理解与文本生成上展现了惊人的能力，却始终面临一道难以逾越的鸿沟：如何在复杂的数学与几何推理中，克服固有的幻觉与逻辑断层？现有的 "结果导向" 训练往往掩盖了推理过程的脆弱性，导致模型常常 "蒙对答案" 却 "想错过程"。这种 "黑盒" 式的学习方式，使得模型难以习得真正鲁棒的推理能力。面对这一挑战，来自上海交通大学、复旦大学、香港中文大学（深圳）、上海人工智能实验室等研究机构的团队提出了一套全新的系统化解决方案： "Formal Enhance Informal Reasoning"（以形式化增强非形式化推理）。该方案的核心洞察在于：利用领域内（In-Domain）极度严谨、可验证的形式化逻辑，可以作为一种强有力的监督信号，去规范和引导模型在非形式化场景下的推理行为。更进一步，研究发现这种在严谨数学环境中习得的逻辑素养，不仅仅局限于几何题，更能作为一把通用的钥匙，解锁模型在通用数学乃至更广泛推理任务上的分布外（OOD）泛化能力。基于这一理念，团队历经三个阶段的探索，构建了从数据底层到模型顶层的完整闭环： ...