林俊旸离职后首发长文
第一财经·2026-03-26 15:05
2026.03. 26 本文字数:1192,阅读时长大约2分钟 作者 | 第一财经 陈杨园 3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,在从阿里离职后,他首度发布长文 详谈自己对大模型发展路线的理解及对AI下一阶段的预判。 林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可 以成为一种被训练出来的能力。DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室 之外被复现、被扩展。这一阶段至关重要。但 2025 年上半年,行业焦点主要停留在"推理式思 考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为 了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。 真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题 是,两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多 样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得 嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可 ...