港科大Apple新研究:Tokens使用量减少,模型推理还更强了
量子位·2025-05-28 04:22
Laser团队 投稿 量子位 | 公众号 QbitAI 1+1等于几? 这一研究也在引起了讨论: 现在的大推理模型(LRMs)已经展现出了非凡的推理能力。但是面对这样最简单的数学问题,现有的LRMs仍需要花费1400+的tokens来思 考。 那么有办法让LRMs在推理思考时更快更强吗? 来自港科大、港城、滑铁卢大学和Apple的研究人员,最近提出了 Laser系列新方法 ,实现了更好的模型效率和准确率平衡,做到了两者的 共同显著提升。 经过Laser和它的进阶方法Laser-D、Laser-DE训练后的模型,相较于训练前模型或者其他方法训练的模型,在准确率(Accuracy)和 Tokens使用效率(Efficiency)上,同时取得了显著的提升。 例如在知名复杂数学推理基准AIME24上,Laser-D和Laser-DE方法能够让模型在减少Tokens使用量 63% 的情况下,还继续提升 6.1 的性 能。 同时,研究人员还发现,经过训练的模型的思考过程里,冗余的"self-reflection"的比例大大降低,呈现出了一种更加健康的思考模式。 那么,Laser是如何让大模型推理又快又好的呢? 三大创新实 ...