Workflow
理想郎咸朋分享对VLA里语言部分的作用
理想TOP2·2025-09-04 02:32

语言是认知世界的框架,而不仅是沟通工具。人类所能思考、理解和表达的一切,都被限制在语言的 范畴之内。我们所理解的世界,很大程度上是我们所使用的语言的产物,对于无法用语言表述的事 物,我们难以形成清晰的思想。而且,不同的语言以其独特的词汇、语法和结构,为使用者提供了不 同的认知框架。所以我们会看到,来自于不同语言体系的人,其思维方式是有差别的。 2025年9月4日,理想汽车自动驾驶负责人郎咸朋微博表示: 在VLA架构里面,V是感知,A是动作,而L承担的是语言能力部分。L对V感知的内容做出认知理解 并形成A的行动规划和决策。VLA的L不是用语言做显式的文字推理,而是用人类语言提供的数据学 习做隐式的逻辑推理,这才是L真正的核心。很多人以为L就是输出在交互界面的那几行文字以及语 音控制命令,这个理解是不对的。其实文字输出和语音输入都是可选的,输不输出都不太关键(看人 类想不想要),真正发挥作用的是背后推理的长思维链。如果没有强大的L,再好的V和A都无法发 挥出来。这跟人与动物的区别很相似。论视觉能力人比不过鹰,论行动速度比不过猎豹,但人之所以 能够称霸地球,靠的是强大的认知和理解能力。而这个认知和理解能力就来自于人 ...