Workflow
高质量解读理想 AI Talk第二季
理想TOP2·2025-05-08 15:02

原作者:微博用户大懒货 原文链接: https://weibo.com/2062985282/PqLTwkUCj https://weibo.com/2062985282/PqTQlabkX ①:VLA 司机模型【司机Agent】最后落地一定是一个 端云一体化的产品【车端VLA 4B+云端 32B VL基 座模型】。原因如下,车端OrinX Thor 算力有限且需要低时延反应,车端的VLA模型参量就一定大不到哪里 去【大了就是跑不动】,因此一定需要用COT 的方式将部分复杂场景分析放在云端VL模型中,将信息分析下 放回车端完成完整的Token输出后用扩散模型转换成轨迹再转换成控制单元。 ②:VLA的VL基座模型为什么要自己去预训练。用第三方LLM做VLM的经验已经告诉我们,如果不是用 原生的基座模型。模型蒸馏以后其他LLM模型里面和驾驶场景无关的知识能力客观来说会影响模型本体的能 力上限。【而车端算力是非常宝贵的,因此做原生驾驶场景的基座模型就是一个非常艰难,但是必须要做的 事情】 【当然如果某一家可能会有更高的车端算力,我觉得尝试用第三方LLM去做蒸馏后强化学习也是可以尝 试一下,毕竟各家搞科研的VLA机器 ...