具身智能之心
Search documents
解决特斯拉「监督稀疏」难题,用世界模型放大自动驾驶的Scaling Law
具身智能之心· 2025-11-20 00:03
点击下方 卡片 ,关注" 具身智能之心 "公众号 编辑丨 机器之心 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 在自动驾驶领域,VLA 大模型正从学术前沿走向产业落地的 "深水区"。近日,特斯拉(Tesla)在 ICCV 的分享中,就将其面临的核心挑战之一公之于众 —— "监 督 稀 疏" 。 这一问题直指当前 VLA 模型的 "七寸": 其输入是高维、稠密的视觉信息流,但其监督信号却往往是低维、稀疏的驾驶动作(如路径点)。那么即便使用 PB 级的 海量数据,VLA 模型的巨大潜力也无法被有效释放。 正当业界热议这一瓶颈时,一支来自国内顶尖学术机构与华为合作的团队,已经悄然给出了破解这一难题的 "锦囊"。一篇名为 《DriveVLA-W0: World Models Amplify Data Scaling Law in Autonomous Driving》 的新工作,为解决这一 "监督稀疏" 提供了极具洞见的解决方案。该研究提出, 世界模型(World Model)是 解锁 VLA 数据规模定律(D ...
如何构建通用具身导航大模型?
具身智能之心· 2025-11-20 00:03
点击下方 卡片 ,关注" 具身智能 之心 "公众号 >>直播和内容获取转到 → 具身智能之心知识星球 点击按钮预约直播 今天晚上我们邀请到了北京大学博士生张嘉曌作客具身智能之心,为大家直播分享他们团队在通用导航大模型领域的一系列前沿探索。 当前具身智能的导航研究多受限于特定任务与机器人平台,为突破这一局限, 他们团队的工作从跨任务的导航大模型Uni-NaVid,推进到跨本体的导航大模型 NavFoM,并成功应用于视觉避障、城区微出行与智能跟随等实际场景。 精彩看点 1.跨任务导航大模型: Uni-NaVid 2.跨任务跨本体导航大模型:NavFoM 3.导航大模型应用 : TrackVLA++, UrbanVLA, MM-Nav 面对非结构化、高动态环境以及需要语言理解的复杂任务,传统导航系统已难以满足需求。导航大模型的出现,将导航算法的范畴从专用能力拓展至通用智能移动 能力,为实现具身智能的落地开启了新的路径。欢迎前来聆听,共同探讨通用导航的未来发展。 参考材料 : Uni-Navid: https://pku-epic.github.io/Uni-NaVid/ NavFoM: https://pku-ep ...
适配简单、效率高!U-Arm:你的具身通用遥操臂来啦~
具身智能之心· 2025-11-19 10:00
有,而且还很好用!这一款遥操臂来了,"U-Arm"通过技术创新实现全面突破。 核心优势可概括为 " 稳、普、省、开 " 四大维度。 具身道用语具管 U-Arm 核心定位 专为具身智能研究与多场景遥操作需求打造的高性价比解决方案, 以"稳定、普适、生态"三大优势,打破传统遥操设备适配难、 成本高的痛点,赋能科研教育领域高效落地。 核心优势 应用场景 (一)U-Arm是什么? 传统遥操设备普遍存在 "适配难、成本高、效率低、封闭化" 四大痛点。 许多同学还在为一款合适的遥操 臂而到处调研,性价比高、开源、适配性强的有没有? 1. 稳定可靠:关节双轴固定设计,解决松动隐患;主体采用 4mm 壁厚光固化树脂材料,兼顾轻量化与抗冲击性。 2. 超强普适: 兼容市面上 95% 商用机械臂(如XArm6、Dobot CR5、ARX R5等),3 种硬件结构遥操臂,控制逻辑统一, 无需二次开发即可快速连接。 3. 生态完善:配套真机遥操(支持关节角度读取)与ROS仿真 例程,轻松搭建"采集 - 训练 - 验证"全流程。 科研数据采集:同步记录多模态遥操数据,适配模仿学习模型 训练,助力具身智能研究高效推进。 教育实践教学:可 ...
调研一下!你们最想关注具身的哪个方向?
具身智能之心· 2025-11-19 04:01
最近正在准备为具身行业起草一份非常丰富的研报,预计明年的第一季度公布。因为涉及的内容和方向非 常多,包括具身公司的融资、产业、政策、算法、落地、出口等多个模块,所以也非常想了解下大家都在 关注哪些内容,侧重点应该在哪里。 为了更好服务大家,我们也简单做个调研,涉及以下板块,支持多选哦~ 微信扫码填写,只需10s 国内具身产业与政策 国外具身产业情况 具身公司融资、业务情况 具身数采相关 具身算法优化部署相关 机器人边缘芯片相关 具身下游产业发展 具身产业人才结构与需求 具身公司上市辅导等 其它 ...
全球首个量产绳驱AI机器人公司完成数亿元A++轮融资!
具身智能之心· 2025-11-19 00:34
以下文章来源于RoboX ,作者RoboX RoboX . 从AI汽车到机器人,我们关注最具潜力的超级智能体! 点击下方 卡片 ,关注" 具身智能 之心 "公众号 本轮融资将重点用于研发人才梯队建设、绳驱本体的规模化制造准备、多场景解决方案深化与产业化能力提 升,进一步推动具身智能的工程化与商业化落地。 全球首个量产绳驱AI机器人 构构建建领领先先""本本体体--遥遥操操--模模型型""具具身身智智能能全全栈栈平平台台 星尘智能是绳驱AI机器人的定义者,也是全球首个实现绳驱AI机器人量产的公司,其产品采用独特的绳驱传动 设计,模拟人类肌腱的丝滑运动与精密力控特性,让机器人刚柔并济, 同时具备高拟人表现力、高动态响应 与高交互安全等先天操作优势 ,特别适合需要复杂灵巧操作和人机交互协作的场景——这是传统刚性机器人 难以胜任的。 星尘智能自创立起就提出了 Design for AI 的软硬件底层架构,并坚信这是 AI 时代人形机器人的底层范式: 绳驱能像"肌腱"一样发力,低摩擦、高跟随、连续力域,不会像传统刚性传动在齿隙、摩擦、冲击中丢失关 键力控信息,让AI能获取连续力学数据并学习人的施力逻辑;而绳子的天然弹性 ...
具身机器人的大脑和小脑分别负责哪个任务?
具身智能之心· 2025-11-19 00:34
Core Insights - The exploration towards Artificial General Intelligence (AGI) highlights embodied intelligence as a key direction, focusing on the interaction and adaptation of intelligent agents within physical environments [1][3] - The development of embodied intelligence is marked by the evolution of its core components, the brain and cerebellum, which are crucial for perception, task understanding, and action execution [1] Industry Analysis - In the past two years, numerous star teams in the field of embodied intelligence have emerged, establishing valuable companies such as Xinghaitu, Galaxy General, and Zhujidongli, driving advancements in embodied intelligence technologies [3] - Major domestic companies like Huawei, JD, Tencent, and Ant Group are actively investing and collaborating to build a robust ecosystem for embodied intelligence, while international players like Tesla and Wayve are focusing on industrial applications and autonomous driving [5] Technological Evolution - The evolution of embodied intelligence technology has progressed through several stages, from low-level perception to high-level task understanding and generalization [6] - The first stage focused on grasp pose detection, while the second stage introduced behavior cloning, allowing robots to learn from expert demonstrations [6][7] - The introduction of Diffusion Policy methods in 2023 marked a significant advancement, enhancing stability and generalization in task execution [6][9] - The current phase emphasizes the integration of Vision-Language-Action (VLA) models, enabling robots to understand human instructions and perform complex tasks [7][9] Future Directions - The industry is exploring the fusion of VLA models with reinforcement learning, world models, and tactile sensing to overcome existing limitations [9][11] - This integration aims to enhance robots' capabilities in long-term tasks, environmental prediction, and multi-modal perception, expanding their operational boundaries [11][12] Educational Initiatives - There is a growing demand for engineering and system capabilities in the field of embodied intelligence, prompting the development of comprehensive educational programs [19] - These programs aim to equip participants with practical skills in strategy training, simulation testing, and the deployment of advanced models [19][20]
1299元起!戴盟发布视触觉新品+端侧AI平台,为具身精细化操作提供更优解!
具身智能之心· 2025-11-19 00:34
Core Viewpoint - The integration of visual and tactile perception in robotics, termed VTLA, is seen as the next evolution in the field of embodied intelligence, addressing the limitations of current models that lack tactile capabilities essential for physical interactions [1][14]. Product Overview - The new product line from Daimeng Robotics, starting at a price of 1299 yuan, represents a comprehensive evolution across four core dimensions, setting a new industry benchmark in technology, product, and pricing [2]. - The product positioning of "beyond touch" indicates its sensory capabilities surpassing human touch, functioning not only as a tactile sensor but also as an edge AI platform aimed at enhancing user experience and advancing the global embodied intelligence industry [2]. Company Background - Daimeng Robotics, incubated at the Hong Kong University of Science and Technology, was co-founded by renowned robotics experts and has raised several hundred million yuan in multiple funding rounds since its official operation in 2023, achieving a new high in the global tactile perception field [4]. - The company has established a solid technological moat through its original monochromatic light tactile sensing technology, which addresses industry pain points such as high computational requirements and poor durability associated with traditional three-color light solutions [4]. Product Features - The DM-Tac W2 tactile sensor offers two sizes with a 55% increase in sensing area for the larger model and a 20% reduction in thickness for the smaller model, catering to diverse operational needs [6]. - The "Blade" tactile sensor features a 28° pointed design, allowing easy access to narrow or complex spaces, enhancing versatility in various scenarios [6]. - The new generation of products boasts improved electromagnetic interference resistance and is the world's first dustproof and waterproof tactile sensor, exceeding the IP65 international standard [8]. - The sensors provide three-dimensional ultra-high resolution and precise six-dimensional force information, with a new micron-level texture recognition capability for applications in precision device defect detection and material classification [10]. AI Integration - The edge AI computing platform DM-Flux can connect to five tactile sensors simultaneously, enabling direct control of grippers and dexterous hands, thus meeting complex multimodal tactile data processing needs [12]. Industry Vision - Daimeng Robotics aims to "break through the limits of physical world perception and build a harmonious world of human-machine coexistence," focusing on disruptive innovations in tactile perception and dexterous manipulation [14]. - The company is also advancing in the field of wearable remote operation devices, with plans to release a new generation of "human-centered" wearable remote operation data collection devices within the year [14].
Physical Intelligence团队正式发布π*0.6!VLA+强化学习训练
具身智能之心· 2025-11-19 00:34
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Physical Intelligence团队 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 11月17号!Physical Intelligence团队正式发布 ,从经验中学习的VLA。 项目链接:https://www.pi.website/blog/pistar06 论文链接:https://www.pi.website/download/pistar06.pdf VLA模型如何通过强化学习在现实部署中实现自我改进? 提出了一种通用方法RECAP:基于经验与校正的优势条件策略强化学习,该方法通过优势条件机制 实现VLA模型的强化学习训练。 该方法将异构数据整合到自我改进过程中,包括演示数据、在线收集数据以及在自主执行期间专家远程干预数据。RECAP方法首先通过离线强化学习预训练通用型 VLA模型(记为 ),该模型随后可通过机器人现场数据收集实现下游任务的专业化性能提升。 实验表明 ...
61岁贝佐斯创业物理AI!亲任CEO,首轮获投62亿美元融资
具身智能之心· 2025-11-19 00:34
贝佐斯亲身下场物理AI了,亲自担任CEO的那种。 纽约时报消息,这名前世界首富创立了一家新公司并亲自担任联席CEO。 而且资金实力雄厚,包括贝佐斯本人出资在内,该公司已获得62亿美元资金。 编辑丨 量子位 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 这也是贝佐斯卸任亚马逊CEO之后,首次担任正式的运营职务。 贝佐斯入局物理AI 去年,贝佐斯投资了具身大牛 Sergey Levine 创立的顶尖AI机器人公司Physical Intelligence,现在他又亲自下场创立了 Project Prometheus ,进军物理AI。 有贝佐斯的下场,这个公司一创立就资金雄厚,获得了62亿美元,约合人民币440亿。 员工规模也达到了上百人,其中包括从OpenAI、DeepMind等顶级人工智能公司挖来的研究人员。 Project Prometheus的研究项目包括将人工智能应用于机器人、药物设计和科学发现等物理任务,明确将重点放在计算机、汽车、航空航天 等高科技 ...
从投稿来看,具身方向的论文已经出现了堆积.......
具身智能之心· 2025-11-18 10:00
最近陆续有几个会议结束了投稿,虽然还没开奖,但投稿数量着实很大。也有很多同学着急忙慌地选择转 投其它会议,什么会议更适合自己?什么方向审稿人更青睐?这是很多同学非常关注的点。其中不乏大模 型、传统机器人、机械方向的同学,还有很多新手。 先看看具身的一些方向,vln、vla、强化、还有一些real2sim2real。很多小白不知道如何下手,选择强化学 习还是vla?传统slam还是vln?哪些方向需要较大算力,哪些不需要?除此之外,什么样的本体适合自己研 究,预算不够怎么办?仿真可以吗? 人形机器人在强化与sim2real/real2sim2real研究上较为活跃,如果实验室有相关本体,可以从这几个方向入 手。 为什么选择我们? 剩下就是一些方法论的问题了,有好的idea至关重要。对很多新人研究者,一个好的idea需要踩很多次坑。 如果你还是新人,不知道怎么入门,可以看看我们推出的论文辅导。 论文辅导上线了 【具身智能之心论文辅导重磅上线!多模态大模型/VLA/强化学习/VLN/遥操作/数采/机器人仿 真/real2sim2real/端到端/diffusion等顶会方向1V1定制化辅导】 辅导区间 CCF-A到 ...