林俊旸离职后首发长文

2026.03. 26 本文字数：1192，阅读时长大约2分钟作者 | 第一财经陈杨园 3月26日晚间，前千问大模型技术负责人林俊旸在社交平台发文，在从阿里离职后，他首度发布长文详谈自己对大模型发展路线的理解及对AI下一阶段的预判。林俊旸表示，过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明，"思考"可以成为一种被训练出来的能力。DeepSeek-R1 紧随其后，证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。但 2025 年上半年，行业焦点主要停留在"推理式思考"本身：如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考：为了行动而思考，在与环境交互的过程中，并根据来自世界的反馈持续更新计划。真正的难点在于数据。当人们谈论合并思考与指令时，往往首先想到模型侧的兼容性，更深层的问题是，两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中，团队并未把所有事情都做对，结果往往是在两个方向上都表现平庸："思考"行为变得嘈杂、冗余或不够果断，而"指令"行为则变得不够清晰、不够可 ...