Workflow
谷歌Gemini Nano Banana
icon
Search documents
大模型的2025:6个关键洞察
3 6 Ke· 2025-12-23 11:39
除了技术路径的更迭,卡帕西还对智能的本质提出了深刻见解。 在这份综述中,卡 帕西详尽地剖析了过去一年中大语言模型 (LLM) 领域发生的底层范式转移。他指出,2025年标志着AI训练哲学从 单纯的"概率模仿"向"逻辑推理"的决定性跨越。 这一转变的核心动力源于可验证奖励强化学习 (RLVR) 的成熟,它通过数学与代码等客观反馈环境,迫使模型自发生成类似于人类思 维的"推理痕迹"。卡帕西认为,这种长周期的强化学习已经开始蚕食传统的预训练份额,成为提升模型能力的新引擎。 北京时间12月21日,OpenAI创始人之一、AI大神安德烈·卡帕西(Andrej Karpathy)发布了名为《2025年大语言模型年度回顾》(2025 LLM Year in Review)的年度深度观察报告。 他用"召唤幽灵" (Summoning Ghosts) 而非"进化动物" ( E volving/growing Animals) 来比喻当前AI的成长模式,解释了为何当前的大语 言模型会展现出"锯齿状"的性能特征——在尖端领域表现如天才,却在基础常识上可能如孩童般脆弱。 此外,卡帕西也对"氛围编程 ( Vi be Coding) " ...
大模型的2025:6个关键洞察
腾讯研究院· 2025-12-23 08:33
Core Insights - The article discusses a significant paradigm shift in the field of large language models (LLMs) in 2025, moving from "probabilistic imitation" to "logical reasoning" driven by the maturity of verifiable reward reinforcement learning (RLVR) [2][3] - The author emphasizes that the potential of LLMs has only been explored to less than 10%, indicating vast future development opportunities [3][25] Group 1: Technological Advancements - In 2025, RLVR emerged as the core new phase in training LLMs, allowing models to autonomously generate reasoning traces by training in environments with verifiable rewards [7][8] - The increase in model capabilities in 2025 was primarily due to the exploration and release of the "stock potential" of RLVR, rather than significant changes in model parameter sizes [8][9] - The introduction of the o1 model at the end of 2024 and the o3 model in early 2025 marked a qualitative leap in LLM capabilities [9] Group 2: Nature of Intelligence - The author argues that LLMs should be viewed as "summoned ghosts" rather than "evolving animals," highlighting a fundamental difference in their intelligence compared to biological entities [10][11] - The performance of LLMs exhibits a "sawtooth" characteristic, excelling in advanced fields while struggling with basic common knowledge [12][13] Group 3: New Applications and Interfaces - The emergence of Cursor represents a new application layer for LLMs, focusing on context engineering and optimizing prompt design for specific verticals [15] - The introduction of Claude Code (CC) demonstrated the core capabilities of LLM agents, operating locally on user devices and accessing private data [17][18] - The concept of "atmospheric programming" allows users to create powerful programs using natural language, democratizing programming skills [20][21] Group 4: Future Directions - The article suggests that the future of LLMs will involve a shift towards visual and interactive interfaces, moving beyond text-based interactions [24] - The potential for innovation in the LLM space remains vast, with many ideas yet to be explored, indicating a continuous evolution in the industry [25]
大模型的2025:6个关键洞察,来自OpenAI创始人、AI大神“AK”
3 6 Ke· 2025-12-22 04:22
他用"召唤幽灵"(Summoning Ghosts)而非"进化动物"(Evolving/growing Animals)来比喻当前AI的成长模式,解释了为何当前的大语言模 型会展现出"锯齿状"的性能特征——在尖端领域表现如天才,却在基础常识上可能如孩童般脆弱。 此外,卡帕西也对"氛围编程(Vibe Coding)"的兴起、本地化智能体的实用化趋势,以及大语言模型图形界面(LLM GUI)的演进进行 了详实的论述。他强调,虽然行业进步迅猛,但人类目前对这一新计算范式潜力的挖掘尚不足10%,未来的发展空间依旧极其广阔。 卡帕西揭示了一个冷酷却又充满希望的现实:我们正处于从"模拟人类智能"向"纯粹机器智能"跨越的临界点。随着RLVR等技术的普 及,2026年的AI竞争将不再局限于算力的军备竞赛,而是转向对"如何让AI高效思考"这一核心逻辑范式的深度挖掘。 以下为卡帕西年度回顾全文: 北京时间12月21日,OpenAI创始人之一、AI大神安德烈·卡帕西(Andrej Karpathy)发布了名为《2025年大语言模型年度回顾》(2025 LLM Year in Review)的年度深度观察报告。 在这份综述中,卡帕西 ...
Karpathy 2025年AI终极觉醒:我们还没发挥出LLM潜力的10%
3 6 Ke· 2025-12-22 00:29
2025年,注定是人工智能历史上被铭记的一年。 如果说2023年是「惊艳」(ChatGPT的横空出世),2024年是「迷茫」(在大模型落地的憧憬中探索),那么在Andrej Karpathy的笔下,2025则是「觉 醒」的一年。 Karpathy一直以来都是AI界的「顶流」布道者。 他的年终总结不仅仅是一篇技术回顾,更像是一部微缩的编年史,记录了LLM如何从「模仿人类的鹦鹉」进化到了「召唤理性的幽灵」。 他以极其敏锐的视角,捕捉到了AI进化的核心:RLVR(基于可验证奖励的强化学习)的崛起、Vibe Coding(氛围编码)的流行、以及那个令人深思的 哲学隐喻: 创造AI,我们到底是在制造一种新的物种,还是在召唤幽灵? 这一次让我们剥茧抽丝,深度解析Karpathy提到的每一个范式转移。 穿过技术术语的迷雾,直抵智能进化的本质,呈现一个真实、疯狂且充满「参差感」的AI-2025年。 第一章:RLVR革命 从「讨好人类」到「追求真理」 在2025年之前,训练一个大语言模型(LLM)的通常包含三道工序: 1. 预训练(Pre-training): 让模型阅读整个互联网,学会预测下一个token。这是「博学」的阶段 ...