几何原理识别和应用

Search documents
Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品
量子位· 2025-04-28 03:43
人类在解答几何问题时,首先会识别所需的几何原理并通过灵活应用它们来推导出答案。 然而,目前的评测方法多集中于最终答案的正确性或简单地对每个推理步骤进行打分,而 忽视了推理过程中的关键因素:几何原理的识别和 应用 。 尽管有研究发现模型的对几何图的感知能力不足限制了其后续推理,但实验发现,几何原理与图像中几何元素的正确对应及应用,是多模态大 模型推理的另一大瓶颈。 为填补这一空白,GeoSense出现了,为在复杂视觉场景中的推理能力提升提供了新的方向。 GeoSense团队 投稿 量子位 | 公众号 QbitAI 多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense ,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。 其背后团队来自 淘天集团算法技术-未来生活实验室团队。 5层知识架构+1789道几何问题 GeoSense旨在系统评估多模态大模型识别和应用几何原理来解决几何问题的能力。 该基准建立了包含定义、定理和公式等几何原理的5层知识架构,覆盖平面几何和立体几何,支持中英双语;精心构建并人工详细标注了 ...