从DeepSeek R1的复现看深度思考模型的未来｜ML-Summit 2025

备受瞩目的 2025 全球机器学习技术大会（ML Summit 2025）将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店召开。本次盛会由 CSDN & Boolan 联合主办，汇聚了超 50 位来自学术界和工业界顶尖专家，共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。作为全球机器学习技术大会的老朋友，新浪微博首席科学家及 AI 研发部负责人张俊林将带来《从 DeepSeek R1 的复现看深度思考模型的未来》的精彩分享。张俊林作为「大模型技术拆解得最通透的实战派」，在 2024 年的机器学习技术大会上，他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解，让开发者直呼"终于有人讲透技术本质"。系统梳理技术脉络：回顾 DeepSeek R1 开源后的各类复现研究，涵盖 SFT 阶段的轻量适配（如 S1）与 RL 阶段的创新实践。深度解析训练范式：重点剖析其核心的两阶段训练模式——如何通过冷启动微调结合多领域数据优化进行 SFT，以及如何运用 GRPO 强化学习与全场景对齐实现模型"深度思考"能力的跃迁。探讨关键技术问题：尝试解答一系列备受关注的核心问 ...