理想VLA的实质 | 强化学习占主导的下一个action token预测
自动驾驶之心·2025-08-11 23:33
以下文章来源于理想TOP2 ,作者理想TOP2 理想TOP2 . 找对社群,深度交流理想长期基本面 作者 | 理想TOP2 来源 | 理想TOP2 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 以下为正文: Ilya是前OpenAI首席科学家,目前在做超级对齐的工作(如果不认为超级对齐非常重要,本质是不信AGI。) 最近十余年AI界多项最重要的变化由其推动。包括但不限于2012年和Hinton/Alex >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文核心分享四条逻辑链: 本文只做学术分享,如有侵权,联系删文 1. 对predict the next token不同的理解本质是对LLM或AI的潜力与实质有不同的理解。 本文架构: 2. 越认为predict the next token不只是概率分布/统计学的人,越容易认可LLM潜力很大/AI潜力很大/推理过程就是意识雏形甚至就是意识/超级对齐非常重要。 3. 不同时真正的深入思考AI与理想,很容易对理想所做之事含金量低估。 4. 理想的VLA实质是在强化学习占主导的连续predict the n ...