Workflow
加州大学最新!做什么?教VLA模型拒绝不可能的任务
具身智能之心·2025-08-25 06:00

点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 出发点与解决的问题 VLA模型在一系列机器人任务中表现出优异性能,其依赖多模态输入,语言指令不仅用于预测动作,还需稳健解读用户意图:即使指令无法执行。本工 作聚焦VLA模型如何识别、解读并响应 虚假前提指令 (即涉及环境中不存在的物体或条件的自然语言命令),提出统一框架 IVA(Instruct-Verify-and- Act) ,核心能力包括: 1. 检测指令因虚假前提无法执行的场景; 2. 通过语言进行澄清或纠正; 3. 将合理的替代方案与感知和动作关联。 为实现这一目标,构建了大规模指令微调数据集(含结构化语言提示),训练VLA模型同时处理有效和错误指令。该数据集为 上下文增强的半合成数据 ,包含成对的"真实前提指令"与"虚假前提指令",支撑模型稳健检测虚假前提并生成自然语言纠正。实验表明,IVA相比基线模型: 领域背景与挑战 1)VLA模型 ...