Workflow
语义对齐
icon
Search documents
理想对VLA的处理思路有可能发生了本质变化
理想TOP2· 2026-03-04 17:17
本质变化在于,认为动作不应该是LLM的输出结果,而应该是LLM的原生语言。通过将坐标直接 token化并引入对数空间分布,让LLM具备了直接操纵物理空间的能力,而不再需要中间的diffusion这 个翻译官。 Token从高维环境特征到物理坐标 贾鹏版的action token是高维环境特征编码思路,包含模型对周围3D空间(基于3DGS高斯表征) 的理解、其他交通参与者的一侧状态以及自车的意图,这种高维环境特征token需要通过 diffusion这个翻译官,才能生成对应的轨迹。Token承载的是3D几何和语义信息,强调的是对环 境的理解。 而LinkVLA版的action token是离散化的BEV空间坐标,每个action token对应一个唯一的网格 坐标,模型输出的不是一个复杂的环境特征包,而是一个由位置token组成的序列,模型把环境 理解留在了LLM的隐藏层里(包括3DGS提取的特征),输出层的token只代表位置。 LLM像预测苹果这个词一样,直接预测坐标网络ID。动作与语言在底层共享同一个词表,从实质 上进行了结构化对齐。 读者有任何不同意见,都欢迎随时指出与交流,TOP2可能存在错误理解。 ...
TikTok内容-人群匹配的“语义对齐”:标签、话题与检索信号
Sou Hu Cai Jing· 2025-08-24 16:37
TTSOP跨境互联 一站式提供TikTok账号 + 静态住宅IP,专为带货直播打造爆量通道。 在TikTok的内容推荐逻辑中,很多创作者一开始都会有一种错觉:只要拍得好,就一定能火。 但真正深耕过的人都知道:内容质量只是必要条件,不是充分条件。 同样的内容,如果标签乱、话题用错,甚至口播和字幕传递的信息不一致,平台就会把你"错送"到不相关的人群里。于是你的视频很可能在错误的受众群体 里沉没,而不是爆发。 所以,想要内容精准触达,必须理解一个关键词:语义对齐。 所谓语义对齐,就是把标题、字幕、话题、语音文本等元素统一成一个强信号,让平台能够正确识别并推荐给目标人群。 下面,我们从四个角度拆解如何做好语义对齐,并配合检索、话题和数据测算形成完整方法论。 一、语义标签体系:训练平台正确理解你 TikTok的推荐机制是一个"灰箱系统",虽然具体权重我们无法完全知道,但确定的是,平台会从多个维度给内容打语义标签。这些标签的准确性,直接决定 了推荐的精准度。 常见的语义信号来源包括: 1. 标题(Title) 1. 字幕(Captions) 当标题、字幕、话题、口播都在反复强化同一个关键词,平台才会明确知道"你是谁",并 ...