梁文锋执笔的R1论文登上Nature封面!首次回应外界三大质疑
AI前线·2025-09-18 02:28
整理|冬梅 9 月 17 日,开源 AI"顶流"DeepSeek 再次引发行业轰动。其推理模型研究论文 DeepSeek-R1,DeepSeek 创始人梁文锋以通 讯作者的名义正式发表在国际顶尖期刊《自然》(Nature)上,并登上当期封面。 这不仅标志着国产 AI 研究迈入世界舞台,也意味着大语言模型首次通过了完整的同行评审,填补了行业空白。 DeepSeek-R1 的核心突破在于,该模型无需依赖大量人工标注的思维链数据,而是借助强化学习(RL)机制,让模型在训练 中自主形成推理能力。研究团队首先基于 DeepSeek-V3 Base 构建出 R1-Zero ,通过只奖励最终预测正确性的方式,引导模 型逐渐学会生成更长、更具逻辑性的回答。随后,团队在此基础上引入多阶段训练,结合监督微调和拒绝采样,最终打造出既 具备强推理性能、又符合人类偏好的 DeepSeek-R1。 在全球开源社区中,DeepSeek-R1 已成为最受欢迎的推理模型之一。截至目前,其在 Hugging Face 平台的下载量已突破 1090 万次 。 新版论文回应质疑, 披露训练细节 与今年初的预印版相比,本次发表于《自然》的论文补充了大 ...