WWDC前夕,苹果论文“炮轰”AI推理模型“假思考”,测试方法遭质疑
每经记者|宋欣悦 每经编辑|高涵 当地时间6月6日,苹果机器学习研究中心发表论文《思考的幻象:通过问题复杂性的视角理解推理模型的优势与局限》。论文作者包括谷歌大脑联合创始人 Samy Bengio(图灵奖得主Yoshua Bengio的弟弟)。 该论文认为,现有的推理模型看似会"思考",但其实并没有稳定、可理解的思维过程,所谓的推理思考只是一种"幻象"。 论文发布后引发AI圈热议,被部分观点解读为"苹果否定所有大模型的推理能力"。也有研究人员提出反驳,认为苹果的测试方法存在问题。AI研究者Lisan al Gaib在复现论文中的汉诺塔测试后发现,模型根本不是因为推理能力不佳而失败,而是因为输出token限制。 图片来源:论文《思考的幻象:通过问题复杂性的视角理解推理模型的优势与局限》 苹果"炮轰"AI推理模型:所谓的思考只是一种"幻象" 论文指出,OpenAI、Anthropic、谷歌和DeepSeek等公司纷纷推出带有"链式思考"(Chain-of-Thought,CoT)能力的模型,并声称它们更接近"类人思维"。 然而,该论文认为,现有的推理模型看似会"思考",但其实并没有稳定、可理解的思维过程,所谓的推 ...