Workflow
机器人视觉
icon
Search documents
从坐标混乱到时空对齐!诺亚和复旦联合提出4D-VLA,提升机器人预训练效率和稳健性
具身智能之心· 2025-07-06 11:54
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Jiahui Zhang等 以 OpenVLA 为代表的主流方法,仅使用 单帧 RGB 图像 + 文本指令 作为条件来拟合动作分布 。这 种极简输入导致目标分布呈现两类混乱: 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 Teaser 在 VLA pretrain 中,单帧 RGB + 文本的传统输入往往缺失关键时空线索,导致坐标系混乱与状态模糊——即同 一观测下可能对应多种动作分布, 显著拉低预训练效率 。为破解这一瓶颈,我们提出 4D-VLA:通过将3D 空间 + 历史帧融入预训练输入,从而抑制混乱分布,提升模型在复杂场景中的performance。 Insight 如何从多源机器人数据中高效提取可迁移的运动知识 ,仍是制约通用操作策略的关键瓶颈。当前公开的 DROID、LIBERO 等大规模数据集为数据驱动控制提供了可能,但 输入信息的不完整与不一致 严重削弱了预训 练的效果。 ...
“3D视觉第一股”奥比中光董事长黄源浩:机器人视觉将超越人眼,未来还有很长的路要走 | 走进上市公司·高见2025
Mei Ri Jing Ji Xin Wen· 2025-07-04 10:56
Core Insights - The article discusses the advancements and future potential of 3D visual perception technology, particularly in the context of robotics and AI, as articulated by Huang Yuanhao, the CEO of Orbbec Technology [2][4][18]. Group 1: Company Overview - Orbbec Technology, founded by Huang Yuanhao in 2013, focuses on developing 3D visual perception technology, which is considered to have disruptive potential in various industries [4][6]. - The company went public in July 2022, becoming the first stock focused on 3D vision technology in the Science and Technology Innovation Board [4]. - As of 2024, Orbbec has 322 R&D personnel, accounting for approximately 47% of its workforce, with R&D investment reaching 204 million yuan, representing 36% of its revenue [6]. Group 2: Market Potential and Growth - The global 3D visual perception market is projected to grow rapidly, with estimates reaching $17.2 billion by 2028 and $15 billion by 2025 [18][20]. - Orbbec has accumulated over 6,000 clients globally in the past three years and aims to exceed 10,000 clients in the next 3 to 5 years [17]. Group 3: Financial Performance - Orbbec's net profit loss has been narrowing, from 615 million yuan in 2020 to 62.91 million yuan in 2024 [8]. - For the first five months of 2025, the company anticipates a cumulative revenue of approximately 363 million yuan, a year-on-year increase of about 117.18%, with a projected net profit of around 55 million yuan [17]. Group 4: Technological Advancements - 3D visual perception technology is evolving from industrial applications to consumer-level products, with Orbbec being one of the few companies with a comprehensive layout across six major technology routes [4][6]. - The technology enables various applications, including biometric recognition, 3D scanning, and industrial measurement, enhancing the capabilities of AI algorithms [7][8]. Group 5: Future Outlook - Huang predicts that the growth of robotics will accelerate significantly once key performance thresholds are crossed, similar to the electric vehicle market [23]. - The future of robotic vision is expected to be highly integrated, focusing on compact, low-power, high-performance visual systems [23][24].
让机器人“看”世界:最好时代与最硬骨头
南方财经记者雷若馨深圳报道 "我们是在最好的时代攀最高的山峰,在最前沿的行业啃最硬的骨头。"奥比中光创始人、董事长兼CEO 黄源浩对南方财经记者表示。 6月25日,南方财经记者跟随"活力中国调研行"采访团来到位于深圳市南山区的奥比科技大厦。这里 是"3D视觉第一股"奥比中光(688322.SH)的总部。 公开资料显示,奥比中光成立于2013年,并于2022年7月在科创板上市。基于自研芯片和全栈式系统技 术,奥比中光为机器人、3D扫描、生物识别等行业客户及全球开发者提供高性能的3D视觉传感器及机 器人与AI视觉方案。 黄源浩把现在称为"最好的时代"。 他表示,很多人说人工智能出来了,大家都变"卷"了,机会似乎变少了。但我个人认为这才是最好的时 代。"从农业时代到工业时代、互联网时代、人工智能时代,只有这个时代,机器人会帮我们所有的 活,这是奇迹来到的时代。" "机器人的视觉能力将来一定会比人类要好得多,它能收集到比人类更多的视觉信息,决策判断能力会 越来越强。"黄源浩相信。 据奥比中光董事、CFO 陈彬介绍,目前奥比中光的业绩正呈现出高速增长的趋势。2024年,奥比中光 的营收实现了56%的增长,今年1~5月份 ...
A股再现奇迹!这只新股大涨276%,市值超700亿元!90后创始人曾破解周鸿祎手机号,也差点被大学开除,如今产品火遍全球
新华网财经· 2025-06-11 07:38
科创板第一位90后创始人来了。 6月11日,影石创新(688775.SH)正式登陆上海证券交易所科创板。上市首日开盘价为182元/股,较发 行价上涨285%,总市值突破700亿元。截至今日收盘,影石创新涨274.44%,市值709.77亿元。 | UY.SU 11:50 | IS.UU | | | | --- | --- | --- | --- | | 分时量 ▼ (2 量: 1197 现手: 1 | 22352 *** 买4 176.96 190 | | | | | | 买5 176.95 22 | | | | 11176 | 大单 176.93 *20 | | | | | 明细 ▲ | | | | | 15:07 177 00 | - | 数据来源:同花顺 此次影石创新科创板上市募资19.38亿元,为2025年以来科创板募资规模排名第一的企业。 超七成收入来自海外 影石创新2015年成立,扎根于智能影像领域,是全景相机、运动相机领域"双料冠军",凭借开创性的技 术,迅速成为全球最受欢迎的智能影像品牌之一。在全景相机领域已连续六年霸榜全球第一,市占率达 到67.2%,2024年上半年营收超越美国老牌厂商Go ...
阿里CEO押注、主攻传感器的乐动机器人,港股IPO募资去“割草”
Hua Er Jie Jian Wen· 2025-06-08 08:09
伴随主题的火热,机器人企业的资本化进程直线提速。 对此,乐动机器人正在加码副业——智能割草机器人。 2025年迄今,乐动机器人的智能割草机器人销量已超1.5万台,超过2024年全年销量。 但面对国内众多品牌入局割草机器人,乐动机器人产品是否足够"扛打",仍待验证。 值得一提的是,乐动机器人背后的明星股东亦是此番IPO的一大看点——阿里巴巴CEO吴泳铭旗下投资 机构圆璟鼎恒参投了乐动机器人,持股比例为1.79%。 供应商"难当" 日前深圳乐动机器人股份有限公司(下称"乐动机器人")向港交所递交了IPO申请。 乐动机器人主攻激光雷达等视觉感知类产品,2024年创收3.41亿元,占比在7成以上。 以2024年收入计,乐动机器人已是全球最大的以视觉感知技术为核心的智能机器人公司。 同年,搭载该公司视觉感知技术的智能机器人数量超过600万台。 即便如此,和A股视觉感知企业奥比中光(688322.SH)动辄超60%的毛利率相比,乐动机器人的毛利 不到前者的三分之一。 视觉感知是乐动机器人的核心产品。 即让机器人具备视觉感知能力,从而实现"看清/看懂"世界的目标,指导机器人做出正确决策。 这一般需要借助算法、传感器等实现, ...
乐动机器人冲击港股上市
机器人大讲堂· 2025-06-06 05:47
2025 年 5 月 30 日,来自广东深圳南山区的深圳乐动机器人股份有限公司 SHENZHEN LDROBOT CO., LTD( 简称 " 乐动机器人 ") 在港交所递交招股书,拟在香港主板挂牌上市 ,海通国际和国泰君安国际担任联 席保荐人。 公司此次募资,计划用于加强智能机器人视觉感知技术的研发,以实现人工智能功能算法结构的升级,优化智 能机器人视觉感知产品及智能机器人产品,品牌建设与国际拓展,优化生产能力及产能扩充,以及探索潜在投 资及收购机会等。 ▍ 核心业务情况分析 招股书显示,乐动机器人的视觉感知产品涵盖传感器、 DTOF 激光雷达、四目矩阵传感器模块等,广泛应用 于扫地机器人、服务机器人及割草机器人等场景 ,是 拥有最全面的智能机器人视觉感知技术产品矩阵的公司 之一,首创多款智能机器人激光雷达创新产品。 具体而言, 乐动机器人于 2018 年推出第一代激光雷达及第一代同步定位与地图构建 (SLAM) 算法,后将其 应用于扫地机器人。 此后,该公司又开发了全球首款消费级 Mini DTOF 雷达, 并 深入应用于各类创新 机 器人领域。 视觉感知技术和产品是公司的第一增长曲线 ,主要是提供广泛的 ...
速腾聚创发布2025Q1业绩,机器人产品销量高增长
Ge Long Hui· 2025-06-02 18:10
速腾聚创发布2025Q1业绩,机器人产品销量高增长【国信汽车旭霞团队】 公司发展近况:截至2025年3月底,公司已成功取得30家汽车整车厂及一级供应商的超过100款车型的量 产定点订单,并为其中12家客户的38款车型实现SOP。2025年1月,公司发布全球首款千线超远距数字 激光雷达EM4,具备1080线发射能力和最远600米探测距离,同时推出两款面向汽车与机器人市场的新 品激光雷达E1R与Airy,以及第二代灵巧手Papert 2.0,拥有20个自由度和14个力传感器。 2025年2月,公司在深圳举办第100万台激光雷达下线仪式,这台激光雷达已正式交付予人形机器人(上 海)有限公司。这标志着速腾聚创成为全球首家达成百万台高线数激光雷达下线的企业。 2025年3月,公司正式推出首款基于Active Camera平台打造的新型机器人视觉产品AC1及AI-Ready生态 系统,AC1是首款实现激光雷达、摄像头与IMU的硬件级融合的传感器,具备120°×60°超大FoV、70米 测距能力2025年4月,公司正式发布全新一代数字化激光雷达EMX,其具备真192线、每秒288万点的高 清点云输出、300米超远探测距离和 ...
擂台之上 “慧眼”助力 人形机器人格斗赛 国产“慧眼”如何让机器人精准识敌
Guang Zhou Ri Bao· 2025-05-28 19:01
近日,宇树G1格斗比赛在业界引发广泛讨论。这场赛事不仅为观众带来娱乐和视觉冲击,更成为机器 人技术发展的风向标。华鑫证券研报指出,此前市场对机器人格斗比赛的预期较低,但此次比赛在机器 人稳定性、瞬间抗冲击能力等方面的表现超预期,有望带动机器人行业的新一轮行情。 热闹的背后,这场比赛的科技含量究竟如何?记者了解到,机器人格斗的实现依赖于力传感器、触觉传 感器、视觉方案等感知技术,以及谐波减速器、电机等核心传动装置。其中,视觉感知技术尤为关键, 它是机器人理解周围环境的核心能力之一。记者专访了深圳机器人视觉公司奥比中光,解读"机器人之 眼"。 "哪双眼"更适合机器人格斗:国产方案实现立体环境感知突破 记者从分析报告了解到,目前,机器视觉领域存在两种主流方案:特斯拉Optimus采用2D摄像头进行视 觉信息输入,通过端到端神经网络方案直接处理其背后的传感数据,也同样延续了其车端的纯视觉感知 方案;而国内厂商则更多采用3D视觉(结构光/ToF/双目)结合激光雷达的方案,以提升环境建模与导 航精度。相比2D视觉,3D视觉在2D成像的基础上增加了深度信息,能够获取视场内的空间几何尺寸, 从而更精准地感知动态环境。 据悉, ...
思看科技(688583):3D视觉核心优势,物理AI第一步(“智”造TMT系列之三十二暨空间智能系列之二)
上 市 公 司 机械设备 2025 年 05 月 21 日 思看科技 (688583) ——3D 视觉核心优势,物理 AI 第一步("智"造 TMT 系列之三十二暨空间智能系列之二) 报告原因:首次覆盖 买入(首次评级) | 市场数据: | 2025 年 05 月 20 日 | | --- | --- | | 收盘价(元) | 111.89 | | 一年内最高/最低(元) | 128.17/88.00 | | 市净率 | 6.6 | | 股息率%(分红/股价) | - | | 流通 A 股市值(百万元) | 1,430 | | 上证指数/深证成指 | 3,380.48/10,249.17 | | 注:"股息率"以最近一年已公布分红计算 | | | 基础数据: | 2025 年 03 月 31 日 | | --- | --- | | 每股净资产(元) | 16.88 | | 资产负债率% | 9.59 | | 总股本/流通 A 股(百万) | 68/13 | | 流通 B 股/H 股(百万) | -/- | 一年内股价与大盘对比走势: -20% 0% 20% 40% 思看科技 沪深300指数 (收益率) 证券分 ...