Workflow
元认知复用
icon
Search documents
推理token减少46%!Meta新方法缩短思维链,告别重复推导
量子位· 2025-10-05 05:43
时令 发自 凹非寺 量子位 | 公众号 QbitAI 大模型老走重复步骤,导致思维链越来越长怎么办? Meta、Mila-Quebec AI Institute、蒙特利尔大学和普林斯顿大学联合提出 元认知复用(Metacognitive Reuse) 机制 。 简单来说,就是让模型自己回顾、总结解题思路,将常用的推理套路提炼成更为简洁的"行为",并将其存储于 "行为手册(Behavior Handbook)" 中。 当再遇到类似问题时,模型便可直接从手册中调用相应的行为,无需重新推导。 实验结果显示,该机制通过行为条件推理、行为引导自我改进、行为条件监督微调三种应用场景,在MATH、AIME等数学基准测试中实现了 显著优化,在保持准确率不变的前提下, 最多可减少46%的推理token使用量 。 下面具体来看。 将重复出现的片段化繁为简 如今,大型语言模型在解决数学、编程等复杂任务时,广泛采用思维链进行推理,所以每次遇到新问题时,都需要重复推导通用子步骤。 这不仅会导致token用量膨胀、推理延迟增加,还会占用上下文窗口空间,降低模型探索新路径的能力。 与此同时,现有LLM的记忆系统(如RAG)仅存储 "是什么 ...