多模态感知 - filings, earnings calls, financial reports, news

多模态感知

Search documents

机器人大讲堂· 2025-07-11 10:35

随着人形机器人在 2025年迎来量产元年，灵巧手落地应用的新元年也即将到来。在不同场景的探索推进下，工业灵巧手已率先从设计初探迈入落地战场 —— 工业生产半开放场景属性下的标准化、高精度刚需，正成为灵巧手落地的理想试验场。针对灵巧手市场低自由度深度内卷的固有格局，灵心巧手推出的 Linker Hand系列灵巧手在国内率先开辟了高自由度灵巧手市场，推动灵巧手产品和技术进入前所未有的加速发展时期。主售产品 Linker Hand L10、L20以及L30均实现20个以上的自由度，并展现出优良的精度和性能表现，高自由度赋予的高灵活性可支持灵巧手完成更加复杂的人手工作，拥有更高的泛化性，适配不同的工业生产任务。目前Linker Hand系列产品已收获广泛的市场认可，实现月订单过千。工业场景对灵巧手有着高自由度、高灵活性、高负载能力等直接需求，灵心巧手驱动技术路线延伸，专门针对工业场景进行高性能灵巧手研发。面向不同需求层级，灵心巧手即将推出两款高自由度 "工业大师"灵巧手 ——Linker Hand L6与L20工业版。其中，Linker Hand L6工业版具有6个 ...

中科院自动化所最新综述！VLA模型后训练与类人运动学习的共性

具身智能之心· 2025-06-29 09:51

点击下方卡片，关注" 具身智能之心 "公众号作者丨 Tian-Yu Xiang等编辑丨具身智能之心本文只做学术分享，如有侵权，联系删文 >> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球 (戳我) ，这里包含所有你想要的。想象学习走路的情景：尽管祖先的经验让一些与生俱来的能力（例如：平衡感、反应）被编码到我们的 DNA中，但要真正学会走路，仍需要在真实环境中不断练习、摔倒、再爬起。经过一段时间的训练，我们的大脑和身体会逐渐协调一致，形成与环境交互的策略。这种由通用能力到特定技能的转变过程在人类中十分常见，而如今，智能机器人也面临着类似的挑战：即便拥有强大的预训练模型作为"大脑"，在执行具体复杂任务前，仍需要经过类似于人类学习的"后训练"阶段，才能在新环境、新任务下达到理想表现。 1. 概述这项工作从人类运动技能学习的角度系统性地对总结 VLA模型（视觉-语言-动作模型）的后训练（post- training）策略。其主要贡献如下： (1) 从人类运动学习视角讨论了VLA模型后训练方法：将人类运动技能 ...

【重磅深度】灵巧手持续迭代，关注技术路线收敛中的边际增量

东吴汽车黄细里团队· 2025-06-27 15:44

Core Viewpoint - The dexterous hand market is expected to grow significantly, reaching $1.706 billion in 2024 and projected to increase to $1.921 billion in 2025 and $3.036 billion by 2030, driven by the demand for humanoid robots that require more advanced dexterous hands with higher degrees of freedom [2][11]. Market Overview - The dexterous hand market is anticipated to reach 760,100 units in 2024, with projections of 861,800 units in 2025 and 1,412,100 units by 2030, reflecting a compound annual growth rate (CAGR) of 10.38% and 9.59% respectively [28][29]. Driving Solutions - The mainstream driving solutions include underactuated, external/mixed, and electric drives, with a shift from hollow cup motors to brushless gear motors. Underactuated designs sacrifice precision for cost reduction and faster deployment, while electric drives are favored for their modular design and high precision [3][11][45]. - Tesla's third-generation dexterous hand has replaced some hollow cup motors with brushless gear motors, indicating a potential shift in motor solutions [3][11]. Transmission Solutions - Transmission solutions encompass gear/worm gear, linkages, screws, and tendon-driven systems, each with its advantages and disadvantages. The tendon + screw composite transmission can enhance transmission precision while maintaining flexibility, exemplified by Tesla's third-generation dexterous hand [4][5][51]. Perception Solutions - Multi-modal perception is a defined trend, with force/torque sensors evolving towards strain gauge types and flexible sensors focusing on enhancing sensitivity and stability. MEMS pressure sensors, particularly resistive types, are becoming more prevalent in dexterous hand applications [6][66][74]. Industry Trends - Both domestic and international products are increasingly pursuing high degrees of freedom and multi-modal perception, highlighting the industry's development trends. Investment recommendations include companies involved in reducers and screw chains, such as Fuda Co., Zhejiang Rongtai, and Wuzhou Xinchun [8][11]. Future Outlook - The iteration of Tesla's dexterous hand clearly indicates a mainstream shift towards tendon-driven systems, achieving a doubling of degrees of freedom, transmission upgrades, drive switching, and breakthroughs in multi-modal perception [7][11].

人形机器人行业深度报告：灵巧手持续迭代，关注技术路线收敛中的边际增量

Soochow Securities· 2025-06-27 07:32

证券研究报告灵巧手持续迭代，关注技术路线收敛中的边际增量 ——人形机器人行业深度报告证券分析师：黄细里执业证书编号：S0600520010001 证券分析师：郭雨蒙执业证书编号：S0600525030002 二零二五年六月二十七日请务必阅读正文之后的免责声明部分报告核心观点 2 ◼下游场景推动灵巧手向仿人手迭代，市场前景广阔。2024 年灵巧手市场规模达 17.06 亿美元，预计 2025/2030 年将增至 19.21/30.36 亿美元。工业机器人常用二指灵巧手执行简单夹取，人形机器人需求促使其向 4 指 / 5 指及高自由度发展。 ◼从驱动方案来看，欠驱动、外置/混合置+电驱为主流，电机或由空心杯向无刷有齿槽切换。具体来看，1）欠驱动靠牺牲精度来降本和加速落地，应用更为广泛；2）外置驱动器和混合置牺牲一定精度短期简单场景落地更快。3）电驱动因模块化设计、精度高等特点为当前主流方案。 4）特斯拉第三代灵巧手以无刷有齿槽电机替换部分空心杯电机，电机方案或将切换。 ◼传动方案涵盖齿轮/蜗轮蜗杆、连杆、丝杠、腱传动杆四类，各有优劣，均可映射至实际产品。其中，腱绳+丝杠复合传动可在保证灵活性 ...

具身智能之心· 2025-06-25 13:52

作者丨视觉语言导航编辑丨视觉语言导航点击下方卡片，关注" 具身智能之心 "公众号 >> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球 (戳我) ，这里包含所有你想要的。主要贡献研究背景 | Task | PointNav | ImageNav | ObjectNav | Audio-GoalNav | | --- | --- | --- | --- | --- | | Description | Navigate to a | Navigate to a | Navigate to a | Navigate to | | | specific 3D point | location matching | specific object. | sound sources. | | | in space. | a visual image. | | | | Sensory Inputs | Visual (RGB, | Visual | Visual (Object | Visual (RGB-D) | | | Depth, ...

具身智能

多模态感知

目标导向导航

Artificial Intelligence

具身智能

多模态感知

目标导向导航

Artificial Intelligence

英国研发新型机器人皮肤

Xin Hua Wang· 2025-06-21 07:37

研究人员将一种柔软、可拉伸且导电的明胶基水凝胶加热熔化，并铸造成一只人手的形状。他们测试了多种电极配置，找出哪种方式最能有效获取不同触觉类型的信息。仅在手腕处放置32个电极，就能从整只手收集到超过170万条信息，这要归功于材料内部密集的微通道网络。随后，研究人员对这种皮肤进行了各种触觉测试：用热风枪加热，用人类手指和机器人手臂对其按压，用手指轻触，甚至用手术刀对其切割。他们将测试过程中采集的数据用于训练一个机器学习模型，使机器人手能识别各种触觉类型所代表的含义。研究人员表示，虽然这种机器人皮肤目前还无法媲美人类皮肤的灵敏度，但它在灵活性和制造简便等方面已经优于现有的任何类似技术，可以通过人类触觉校准，用于多种任务。未来除了应用在人形机器人或人类假肢等需要触觉感知的场景，这种机器人皮肤还可以广泛应用于汽车制造、灾后救援等不同行业。新华社北京6月21日电英国研究人员近期研发出一种由柔软且低成本的凝胶材料制成的新型机器人皮肤，可同时感知压力、温度等，甚至可以区分多个接触点，从而使机器人能以类似人类的方式获取周围环境信息。由剑桥大学和伦敦大学学院研究人员组成的团队近期在美国《科学·机器人学 ...

近20个交易日“吸金”超15亿元，科创芯片ETF（588200）小幅上涨，源杰科技涨超4%

2 1 Shi Ji Jing Ji Bao Dao· 2025-06-04 02:41

资金流向方面，Wind金融终端数据显示，科创芯片ETF（588200）近20个交易日有15日获资金净流入，累计"吸金"超15亿元。科创芯片ETF（588200）跟踪科创芯片指数，该指数从科创板上市公司中选取业务涉及半导体材料和设备、芯片设计、芯片制造、芯片封装和测试相关的证券作为指数样本。此外，科创芯片ETF（588200）还配备了场外联接基金（A类：017469；C类：017470）。东莞证券表示，据多家媒体或机构报道，受益于存储原厂减产以及AI基建的旺盛需求推动企业级存储需求增长，存储器行业供需格局有望改善，价格走势有望优于预期。相较海外巨头，本土存储企业有望通过大容量产品和主控芯片等技术创新，以及产业链和服务本地化缩小与国际品牌的差距，份额相比 2023年有较大幅度提升，建议关注存储芯片设计、存储模组、DDR5等相关受益环节；AI应用方面，近日字节豆包上线"视频通话+联网搜索"功能，是多模态感知技术商业化落地进程中的标志性事件，表明多模态感知技术进入商业化落地阶段，尤其是给视觉交互领域带来的突破有望拉动上游算力芯片和AI 终端SoC芯片需求增长。（本文机构观点来自持牌证券机构，不构成 ...

Yuanjie Semiconductor Technology (SH:688498)

Artificial Intelligence

多模态感知技术

Semiconductor

科创芯片ETF（588200）

Artificial Intelligence

多模态感知技术

Semiconductor

科创芯片ETF（588200）

向“智”出发，“触”见未来——“中国传感谷”探访记

Xin Hua She· 2025-05-29 01:58

"具身机器人、智慧交通、低空经济等领域的发展，为传感器产业拓展出巨大的想象空间。"华鑫微纳副总经理丁敬秀说，目前这条生产线正处于产能爬坡阶段，满产后可以助力产业集聚发展。聚焦产业链短板持续补链、强链、延链，"中国传感谷"吸引了200多家智能传感器上下游企业集聚发展，其中专精特新企业40多家，初步构建起智能传感器材料、设计、制造、封装、测试和应用的全产业链体系。一款仅有指甲盖大小的电流传感器，在现实场景中，既可充当智能操控的"安全员"，也可成为安全监测的"预警器"，这款产品来自园区的安徽希磁科技股份有限公司。让机器人灵巧手实现精准抓握的柔性触觉传感器、助力智能驾驶信息交换共享的高性能惯性传感器…… 近日，记者走进位于安徽省蚌埠市的"中国传感谷"展厅，从智能传感器到各种终端应用，一款款新产品新技术呈现在眼前。日前在蚌埠市举办的第七届智能传感器产业发展大会上，当地企业展示的装有智能传感器的机器人灵巧手。新华社记者王菲摄随着人工智能的发展，传感器产业迎来发展风口。 "作为安徽省人工智能产业版图上'三谷联动'中的重要一极，地处淮河之滨的蚌埠市早在上世纪90年代已是传感器制造基地。"蚌埠经济开发 ...

一张照片、一句简单提示词，就被ChatGPT人肉开盒，深度解析o3隐私漏洞

机器之心· 2025-05-09 09:02

论文链接：https://arxiv.org/abs/2504.19373 案例直击：AI 如何从照片中 "挖" 出你的坐标？用户提示词示例：一作为罗威迪（俄亥俄州立大学本科生，佐治亚大学未来博士生，在 COLM 和 ACL 系列顶级会议中发表多篇文章），以及来自威斯康星大学麦迪逊分校的本科生张起明和陆天宇。一张普通的生活照，可能成为 AI 破解你隐私的钥匙 —— 这不是科幻情节，而是最新研究揭示的残酷现实。OpenAI 的多模态大模型 ChatGPT o3，竟能通过照片中微不可察的线索，将你的住址锁定在 1 英里范围内。近日，来自威斯康星大学麦迪逊分校教授肖超玮（Chaowei Xiao）主导并联合佐治亚大学教授向臻（Zhen Xiang）, 南加州大学教授赵越（Yue Zhao）团队完成的一项新研究，揭示了自主多模态大语言推理模型严重的隐私泄露风险 —— 图片地理位置定位。论文标题：Doxing via the Lens: Revealing Privacy Leakage in Image Geolocation for Agentic Multi-Modal Large Reasoni ...