Workflow
test-time compute
icon
Search documents
5分钟读懂Lilian Weng万字长文:大模型是怎么思考的?
Hu Xiu· 2025-05-22 09:54
最近有三篇很火的bolg,第一篇是OpenAI researcher 姚顺雨的"欢迎来到下半场",第二篇是David Silver 和Richard S. Sutton的"Welcome to the Era of Experience",这是第三篇,Lilian Weng的Why We Think。 Lilian Weng的最新blog,还找了John Schulman润色。 道理其实很朴素,里边的内容大家都聊过,我们绝大部分也单独写过,但是这篇blog系统性地梳理了AI 最新范式:test-time compute。 LLM大模型是怎么思考的? ①从心理学角度:理论来源于丹尼尔·卡尼曼的《思考,快与慢》。 与人类思考方式有相似之处。 人脑有"系统1"(直觉、快速)和"系统2"(分析、缓慢)。 在推理模型出现之前,大模型的答案"脱口而出",这就是系统1。给AI多点时间思考,就像是激活了它 们的"系统2"。 ②从计算资源角度: ③从数学角度: 可以把整个"问题 (x) - 思考过程 (z) - 答案 (y)"看作一个概率模型。 思考过程z就是那个隐变量(hidden variable)。把各种可能的思考路径都 ...
晚点播客丨OpenAI o1 如何延续 Scaling Law,与硅基流动袁进辉聊 o1 新范式
晚点LatePost· 2024-09-20 15:22
"如果每天和开发者打交道,你不会感觉这个行业停滞或变冷。" 文丨程曼祺 贺乾明 扫描图中右下角二维码,可收听播客。* 这是《晚点聊 LateTalk 的第 80 期节目,欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目,在文字报道之外,用音频访谈形式捕捉商业世界变化的潮流和不变的逻辑,与这 其中的人和故事。 OpenAI 发布新模型 o1 后的第二天,我们邀请了硅基流动创始人袁进辉与我们分享了 o1 的技术意义,也讨论了今年 1 月至今,袁进辉观察 到的 AI 开发者社区变化。 o1 的一个重要变化就是增加了分配给推理(inference,即大模型的使用)阶段的算力,推理阶段计算(test-time compute)重要性提升。 而袁进辉今年初创立的硅基流动(SiliconFlow)就是一家做推理加速优化的 AI Infra(中间层软件)公司。他是一位连续创业者,曾在 2017 年创立一流科技(OneFlow),在 2023 年加入王慧文组建的大模型创业公司光年之外,成为联合创始人。(袁进辉的上两段创业故事,可 听 ...