SmolVLA

Search documents
AnywhereVLA:在消费级硬件上实时运行VLA
具身智能之心· 2025-09-29 02:08
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Artem Voronov等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 一、核心背景与目标 当前移动操作技术正从封闭、结构化的工作单元,向开放、非结构化的大型室内环境拓展——机器人需在陌生杂乱空间中探索,与多样物体及人类互动,同时响 应自然语言指令完成任务(如家庭服务、零售自动化、仓储物流等场景)。但现有方案存在明显瓶颈: 为此,AnywhereVLA提出模块化架构,核心是融合经典导航的鲁棒性与VLA模型的语义理解能力,实现 未知大型室内环境下的语言驱动拾取-放置任务 ,且能在 消费级硬件上实时运行。 二、相关工作回顾:现有方案的优势与不足 1. VLA模型与轻量化优化 2. 扩散Transformer与导航相关方案 三、AnywhereVLA架构:四大核心模块与工作流 AnywhereVLA以自然语言指令为输入,通过四大模块协同输出低级别控制指令(驱动基座车轮与机械臂关节),整体 ...
VLA-Adapter:以0.5B参数实现机器人智能新高度,还无需预训练
具身智能之心· 2025-09-17 03:14
>> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 点击下方 卡片 ,关注" 具身智能之心 "公众号 | | OpenVLA-OFT (soTA) | | VLA-Adapter (Ours) | | --- | --- | --- | --- | | Backbone ↓ | 7B | 0.5в | 1/14× | | Fine-tuning Cost ↓ | 304GPU·h | 8GPU.h | 1/38× | | Training VRAM (8 batch)↓ | 62GB | 24.7GB | 0.4× | | Throughput (8-dim chunk) ↑ | 71.4Hz | 219.2Hz | 3× | | Performance (LIBERO) ↑ | 97.1% | 97.3% | Maintain | | VLM # / 3 | Bridge | Policy | Frozen | | | | | ు Trainable | | / IRGB L Instuction | A ...
GPT重大更新,Hugging Face发布开源机器人AI模型
Mei Ri Jing Ji Xin Wen· 2025-06-05 00:57
周三(2025年6月4日),截至收盘,科创人工智能ETF华夏(589010)上涨0.2%,持仓股方面,奥普特 上涨4.65%领涨,有方科技上涨2.96%、金山办公上涨2.72%涨幅靠前;机器人ETF(562500)上涨 0.6%,持仓股方面,亿嘉和上涨5.65%领涨,奥普特上涨4.65%、绿的谐波上涨4.61%涨幅靠前。当日交 易金额4.41亿元,居相同标的ETF首位,换手率3.43%,市场成交活跃。 【市场复盘】 【热点要闻】 1.6月5日凌晨1点,OpenAI开始技术直播对ChatGPT进行了重大更新,包括向macOS用户推出ChatGPT会 议记录模式,可以转录任何会议、头脑风暴或语音笔记,并快速提取要点然后转化为新的内容。另外一 个重要功能就是ChatGPT正式支持MCP协议,例如,直接连接Github、SharePoint等常用工具,实现跨 平台数据整合、搜索和推理。简单来说,OpenAI希望把ChatGPT打造成智能协作平台。 2.6月4日,OpenAI宣布,公司的付费企业用户已突破300万,较2月份报告的200万实现了爆发式增长, 并进行了一些产品的更新与升级。据OpenAI介绍,这300万用户 ...