Workflow
预测下一个token
icon
Search documents
理想VLA实质是强化学习占主导的持续预测下一个action token
理想TOP2· 2025-08-11 09:35
本文核心分享四条逻辑链: 2.越认为predict the next token不只是概率分布/统计学的人,越容易认可LLM潜力很大/AI潜力很大/ 推理过程就是意识雏形甚至就是意识/超级对齐非常重要。 1.对predict the next token不同的理解本质是对LLM或AI的潜力与实质有不同的理解。 3.不同时真正的深入思考AI与理想,很容易对理想所做之事含金量低估。 4.理想的VLA实质是在强化学习占主导的连续predict the next action token,类比OpenAI的O1O3。且 辅助驾驶比chatbot更适合用强化学习。 本文架构: 先介绍为什么Ilya的观点值得重点参考,再分享Ilya对predict the next token的英文原文与中文翻译。最 后类比一下与理想VLA的关联以及为何理想所做之事含金量被低估。 以下为正文: Ilya是前OpenAI首席科学家,目前在做超级对齐的工作(如果不认为超级对齐非常重要,本质是不信 AGI。) 最近十余年AI界多项最重要的变化由其推动。包括但不限于2012年和Hinton/Alex Krizhevsky 推出 AlexNet, ...