大模型的2025:6个关键洞察
3 6 Ke·2025-12-23 11:39
除了技术路径的更迭,卡帕西还对智能的本质提出了深刻见解。 在这份综述中,卡 帕西详尽地剖析了过去一年中大语言模型 (LLM) 领域发生的底层范式转移。他指出,2025年标志着AI训练哲学从 单纯的"概率模仿"向"逻辑推理"的决定性跨越。 这一转变的核心动力源于可验证奖励强化学习 (RLVR) 的成熟,它通过数学与代码等客观反馈环境,迫使模型自发生成类似于人类思 维的"推理痕迹"。卡帕西认为,这种长周期的强化学习已经开始蚕食传统的预训练份额,成为提升模型能力的新引擎。 北京时间12月21日,OpenAI创始人之一、AI大神安德烈·卡帕西(Andrej Karpathy)发布了名为《2025年大语言模型年度回顾》(2025 LLM Year in Review)的年度深度观察报告。 他用"召唤幽灵" (Summoning Ghosts) 而非"进化动物" ( E volving/growing Animals) 来比喻当前AI的成长模式,解释了为何当前的大语 言模型会展现出"锯齿状"的性能特征——在尖端领域表现如天才,却在基础常识上可能如孩童般脆弱。 此外,卡帕西也对"氛围编程 ( Vi be Coding) " ...