Workflow
翁荔最新万字长文:Why We Think
量子位·2025-05-18 05:20

网友们看罢,纷纷打出了 "精彩" 二字: 感觉就像打开了人工智能理解的一个全新维度。 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 《Why We Think》。 这就是北大校友、前OpenAI华人VP 翁荔 所发布的最新 万字长文 —— 围绕"测试时计算"(Test-time Compute)和"思维链"(Chain-of-Thought,CoT),讨论了如何通过这些技术显著提升模型性能。 翁荔表示: 让模型在输出答案前多思考一会儿(比如通过智能解码、思维链推理、潜在思考等方法),能显著提升它的智能水平,突破当前的能 力瓶颈。 那么接下来,我们就来深入了解一下这篇文章。 动机 让模型思考更长的时间可以通过几种不同的方式来激发。 心理学类比 核心思想与人类思考方式深度关联。 人类无法立即回答"12345×56789等于多少?",而是需要时间分析——这正是Daniel Kahneman在《思考,快与慢》(2013)中提出的双 系统理论: 因为系统1思维是快速和简单的,它经常以准确性和逻辑性为代价,成为主要的决策驱动因素。它自然依赖于我们大脑的思维捷径(即启发 式),并可能导致错误和偏见。 通过有意识地放 ...