Workflow
全模态数据集(OmniSharing DB)
icon
Search documents
具身智能竞赛转向“基建”,深圳帕西尼投产大型数据工厂
Nan Fang Du Shi Bao· 2025-06-25 11:51
为破解这一难题,该工厂采用了一套"无本体依赖"的数据采集系统,通过部署150个标准化的采集单 元,直接捕捉人类在真实场景中完成复杂任务时的手部动作姿态、空间轨迹和力学交互信息。这一方式 在理论上能够显著降低数据生产的成本,并摆脱特定机器人构型的限制,使产出的数据具备更广泛的通 用性。 在此基础上,该工厂通过其自研的"多模态神经织网技术(Neural Mesh)",将高精度的触觉数据与视 觉、关节角度、语音等信息进行同步融合,形成丰富的高维数据流。同时,借助"体感重定向系统 (Soma Redirect)",这些采集自人类的数据能够被有效适配和"重定向"至不同结构、不同型号的机器 人本体上,旨在解决长期困扰行业的模型跨本体泛化难题,让模型训练的成果能在更广泛的硬件上得到 应用。 事实上,为解决数据这一根本性问题,具身智能全行业正呈现出多元化的基础设施建设路径。帕西尼 的"第三方数据服务工厂"模式是其中之一,但并非孤例。 以上海的智元机器人为例,其正采取一种"自建自用"的垂直整合策略。该公司在推进临港量产工厂建设 的同时,也在张江建立了大规模的数据采集中心,通过上百台机器人进行7x24小时不间断的数据生产与 模型 ...
具身智能机器人,开始布局超级数据工厂了
据了解,为保证数据的广泛适配性,帕西尼在工厂内部部署150个标准化采集单元,每个标准化数据集 采集都基于真人手部动作姿态来捕捉,并通过"空间视觉矩阵"进行"视觉-触觉"模态对齐,极大地提升 了数据的通用性。同时,后续通过体感重定向系统(Soma Redirect),采集而来的数据还能向不同型 号、不同设计的机器人输出,使得数据集有效突破模型的跨本体泛化能力瓶颈。 数据采集量所面临的第二个问题就是成本。帕西尼方面表示,由于无需依赖昂贵的机器人本体进行数据 采集,帕西尼的解决方案显著降低了采集成本,使得大规模、高质量的数据生产成为可能,为行业发展 提供了经济高效的路径。 6月23日,南方财经记者从帕西尼感知科技(深圳)有限公司(以下简称"帕西尼")处获悉,该公司主 导建设的具身智能超级数据工厂(Super EID Factory)正式投入运营。 作为深圳本土培育的前沿科技企业,本次帕西尼落成的数据工厂选址于天津市河西区空天数字产业园, 面积近12000平方米,预计年产近2亿条高维训练数据。 帕西尼方面称,这座超级数据工厂是目前全球范围规模最大、数据采集体量领先的具身智能数据采集与 模型训练基地,将为当前具身智能产 ...