推理式思考
Search documents
林俊旸离职后首次发声:复盘千问的弯路,指出AI的新路
创业邦· 2026-03-27 07:18
来源丨 量子位(ID:QbitAI) 作者丨 梦晨 林俊旸 ,离职阿里千问后首次发声。 他没有回应离职风波或宣告去向,而是发长文探讨从"推理模型时代的思考"到"智能体时代的思考"的转变。 整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。 他在文中坦白承认"我们没有全做对"(We did not get everything right), 千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。 Qwen3就是这个方向上"最清晰的公开尝试之一",它引入了混合思维模式。 但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。 在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。 面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。 OpenAI的o1和DeepSeek-R1证明了推理能力可以被训练和复现,这教会了整个行业一个关键认知: 要在语言模型上做强化学习,需要确定性强、可规 ...
林俊旸离职后首发长文
新华网财经· 2026-03-27 03:22
林俊旸预测,智能体式思考会成为主流。 3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,在从阿里离职后,他首度发布长文详谈自己对大模型发展路线的理解及对 AI下一阶段的预判。 林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可以成为一种被训练出来的能力。 DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。但 2025 年上半年,行业焦 点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考, 在与环境交互的过程中,并根据来自世界的反馈持续更新计划。 他提到,2025 年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类 似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真 正困难的问题投入大量计算。概念上,这是正确的方向。但"合并"说起来容易,做好却极难。 真正的难点在于数据。当人们谈论合并思考与指令时, ...
林俊旸离职后首度发声:万字复盘,大模型下一站「智能体式思考」
机器之心· 2026-03-27 00:10
机器之心编辑部 本周四晚,前阿里千问大模型负责人林俊旸(Junyang Lin)在离职阿里千问后的首度公开发声,立刻在 AI 科技圈引发了关注。 自三周前自宣离开后,林俊旸这次并没有谈论个人的职业规划或离职内幕,而是发表了一篇题为《From "Reasoning" Thinking to "Agentic" Thinking》(从「推理式思考」到「智能体式思考」)的长文。 这篇文章深度复盘了过去两年大模型行业的演进,特别是千问团队在研发 Qwen3 时走过的弯路,并前瞻性地指出了 AI 大模型未来的绝对主线。 以下是全文内容: 过去两年重塑了我们评估(大语言)模型的方式以及我们对模型的期望。OpenAI 的 o1 表明, 「思考」 可以成为一项核心能力,可以进行训练并 向用户展示。DeepSeek-R1 证明了推理式的后训练可以在原始实验室之外复现和扩展。OpenAI 将 o1 描述为一个使用强化学习训练的模型,其特 点是「先思考后回答」。DeepSeek 将 R1 定位为一个与 o1 竞争的开放式推理模型。 这一阶段至关重要。2025 年上半年我们主要关注的是推理思维:如何让模型花费更多时间进行推理计算,如 ...
林俊旸离职后首次发声!复盘千问的弯路,指出AI的新路
量子位· 2026-03-26 16:01
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 林俊旸 ,离职阿里千问后首次发声。 千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。 Qwen3就是这个方向上"最清晰的公开尝试之一",它引入了混合思维模式。 但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。 在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。 他没有回应离职风波或宣告去向,而是发长文探讨 从"推理模型时代的思考"到"智能体时代的思考"的转变 。 整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。 他在文中坦白承 认 "我们没有全做对" (We did not get everything right), 面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。 OpenAI的o1和DeepSeek-R1证明了推理能力可以被训练和复现,这教会了整个行业一个关键认知: 要在语言模型上做强化学习,需要确 ...
林俊旸离职后首发长文
第一财经· 2026-03-26 15:05
2026.03. 26 本文字数:1192,阅读时长大约2分钟 作者 | 第一财经 陈杨园 3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,在从阿里离职后,他首度发布长文 详谈自己对大模型发展路线的理解及对AI下一阶段的预判。 林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可 以成为一种被训练出来的能力。DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室 之外被复现、被扩展。这一阶段至关重要。但 2025 年上半年,行业焦点主要停留在"推理式思 考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为 了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。 真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题 是,两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多 样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得 嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可 ...