数据采集 - filings, earnings calls, financial reports, news

数据采集

Search documents

具身智能之心· 2025-06-23 13:54

数据部分：遥操采集依赖本体，成本较高。但前处理和后处理较为简单，质量也最高，适用于机械臂。VR 遥操+动捕手套方案，操作员会戴上 VR 眼镜用于和机器人的视野对齐，动捕手套捕捉的手指运动转发到灵巧手上，适用于人形机器人。算法部分：VLN、VLA、Diffusion Policy、强化学习等是具身常用的技术栈，方法更新较快，需要保持paper reading。硬件部分：预算足的实验室有经费购买20-30w的本体，预算不足的同学依赖3D打印自己制作机械臂或者采购性价比高的硬件平台，甚至在仿真里面做，研究比较受限。我们的具身社区针对这三个大的模块做了比较充足的分享，包括数据采集方案、本体、仿真以及算法部分，同时也给大家提供了几款高性价比的机械臂平台，助力研究。入门具身离不开3个要素，数据+算法+本体，说实话很多同学只懂算法，甚至说懵懵懂！数据的采集更是需要经验，遥操和retargeting方案，很多人采集不到真实有效的数据。本体更是许多同学触不可及的东西，高性价比的平台和仿真是很多同学入门的第一步。社区目标是3年内打造一个万人聚集的地方，这里也非常欢迎优秀的同学加入我们（目前已经有很多具身 ...

news flash· 2025-06-18 23:29

据中国证券报消息，智元数据采集中心在上海浦东运营，通过"数据+AI"提升机器人智能化水平。自 2024年9月启动以来，该中心已采集超百万条高质量数据，覆盖多种真实场景。智元机器人开源了百万真机数据集AgiBot World，并发布了通用具身基座模型GO-1，提升机器人学习效率。今年4月推出的 Genie Studio平台，为开发者提供一站式解决方案。预计2025年，智元机器人将进入量产化元年，推动产品商用，出货量达数千台。公司已完成新一轮融资，支持其智能化进程。(中国证券报) ...

2025-05-21 15:14

机器人数据仿真专家 20250521 摘要 VLA 仿真在机器人感知深度学习中应用广泛，但在真实场景迁移效果差，主要受限于图像真实感和物理参数模拟的挑战，现阶段更适用于算法原型验证。机器人训练中，传感器仿真、物理交互和场景重建是常用的数据生成方法，但高逼真图像生成和精确物理参数模拟仍是难题，限制了模型在真实世界的泛化能力。仿真器在机器人训练中优势明显，尤其在电信号仿真方面，但感知层面的数据分布差异导致环境交互效果不佳，仿真可迁移性取决于任务的数据分布差距。通过观看视频训练自动驾驶系统和机器人面临模态差异和重建精度问题，难以实现完整动作或任务流的学习，视觉语言规划可作为辅助手段。当前主流数据采集及训练方式依赖真实量产数据闭环，机器人领域则依赖仿真器，但仿真数据训练的模型在真实世界中泛化性较差。数据而非模型是当前主要挑战，硬件不统一和数量不足导致数据量少且质量参差，跨本体数据运用受限，需标准化硬件尺寸和旋转比例以提高数据利用效率。人形机器人在工业场景中的价值在于通用性，而非精细化操作，通过解耦方式采集数据，标准化传感器并解耦本体，可确保数据的共用性。 Q&A 仿真数据在机器人任务 ...

2025-05-20 15:24

机器人动捕设备专家 20250520 摘要 • 当前机器人数据采集主要有四种模式，包括真实动捕训练本体、动捕结合虚拟引擎、纯动捕系统和模拟合成数据，有效数据比例差异显著，直接影响训练效果和成本。 • 海外公司如 Tesla 已批量采购 Adesso 设备，采用真人动捕训练和虚拟仿真 DNF 模式。国内公司多处于技术验证阶段，采用遥操动捕设备和少量设备结合真人动捕与虚拟 YDF 模式。 • 数据有效性通过真人动作初步验证和机器人反向验证姿态来衡量，行业内尚无统一标准，涉及多传感器信息融合以确保评估结果的可靠性。 • 简单动作如抓水杯只需数小时数据积累，而通用泛化性需几十万甚至数百万小时。数据复用关键在于重定向过程，将人的高自由度数据映射到机器人，难点在于末端精度协调和自然衔接。 • 数据采集效率极低，1,300 秒数据需经验丰富的动捕专家使用上百万设备连续工作十几天。核心问题在于虚拟本体软件不够成熟，与真实物体交互面临挑战。海外公司如 Tesla 已经开始大批量采购 Adesso 设备，并采用两种主要流程：一是真人穿着人体动捕服训练真实本体以采集数据；二是使用虚拟仿真平台通过 DNF 模 ...

高德地图|生活服务实体店高德地图数据采集软件，百度地图高德地图商户数据采集软件合理运用

Sou Hu Cai Jing· 2025-05-20 04:48

在数字化时代，地图数据已成为商业分析、市场调研和位置服务的重要基础。高德地图、百度地图等平台汇聚了海量的POI（Point of Interest，兴趣点）数据，包括商户信息、地址、联系方式、用户评价等。这些数据对于企业选址、竞品分析、本地化营销等具有重要参考价值。因此，部分用户希望通过自动化工具采集地图数据，以提高效率。本文将探讨地图数据采集的应用场景、技术实现方式、潜在风险以及合规替代方案。地图数据采集的应用场景 1. 商业选址分析数据采集软件的技术实现方式目前，市面上常见的地图数据采集方法主要包括以下几种： 1. 爬虫技术（Web Scraping / API 逆向） 2. 零售、餐饮、连锁企业需要分析特定区域的商户分布、人流量、竞争情况，以优化门店选址策略。 3. 竞品监控 4. 企业可能希望定期采集竞争对手的门店信息（如新店开业、关店调整），以制定市场策略。 5. 本地化营销 6. 广告公司或服务商需要获取特定行业的商户数据（如餐饮、教育机构），以便进行精准推广。 7. GIS（地理信息系统）研究 8. 城市规划、交通管理等领域的研究人员可能需要POI数据用于建模分析。 9. O2O平台数 ...

从条形码到二维码，沃尔玛和微信如何重塑商业运作的基础设施丨晚点周末

晚点LatePost· 2024-07-14 12:00

过去 50 年最重要的技术之一，塑造了我们的生活，使我们习以为常。文丨曾梦龙编辑丨钱杨黄俊杰当一个基础设施变得非常成功时会发生什么？美国克莱姆森大学的教授乔丹·弗里斯（Jordan Frith）觉得是这样：人们不再想它，它也逐渐淡出人们的视线。 "条形码是一个典型的例子。" 他在去年出版的《条形码》（Barcode）中写道： "条形码的隐蔽和平凡正是其成功的最终象征。 " 50 年前，条形码在美国应用于商业，如今几乎无处不在。食品、快递、书籍、门票、医药、登机牌上都可看到它的身影。全球每天大约出现 60 亿次扫描条形码的 "嘀嘀" 声，每秒钟售出约 7 万件商品。同样，由于已经是成功的基础设施，二维码早已让人习以为常。 2012 年，条形码的后代二维条形码（2D barcode，简称 "二维码"）借助移动支付率先在中国得到大规模应用。它让互联网平台成为消费者和商户的连接者，推动了支付宝和微信崛起。中国人每天几乎都要用智能手机 "扫一扫" 好几次，无论是买菜、坐地铁，还是想打开一辆共享单车，或添加一个人为微信好友。条形码和二维码是 "自动识别和数据采集"（AIDC）领域的众多技术之一， ...