特斯拉Optimus

Search documents
具身目标导航是怎么找到目标并导航的?
具身智能之心· 2025-07-13 04:13
说到机器人导航,技术路线已经逐渐从早期传统的建图定位导航,到后期基于大模型方案的导航演变。而 基于大模型方案的导航又分为视觉语言导航和目标导航! 如果说一句话说明这两个任务的区别,视觉语言导航是""听懂指令走对路",目标导航是""看懂世界自己找 路"。 视觉语言导航是什么? 点击下方 卡片 ,关注" 具身智能 之心 "公众号 与传统视觉语言导航(VLN)依赖显式指令不同,目标驱动导航系统需要实现从"听懂指令走对路"到"看懂 世界自己找路"的跃迁:当人类下达"去厨房拿可乐"的指令时,机器人需自主完成语义解析(识别厨房空间 特征与可乐视觉属性)、环境建模(构建家居场景的空间拓扑)以及动态决策(避开移动的人类或宠 物),这背后凝聚着计算机视觉、强化学习与3D语义理解的交叉突破。 商业落地与需求怎么样? 视觉语言导航本质上是个指令跟随的任务。任务囊括了三个方面,理解语⾔指令、感知周围环境,规划运 动策略。一般来说,VLN机器人系统主要由视觉语言编码器,环境历史信息表征,以及动作策略三个模块 构成。 机器人从环境中获取语⾔指令和每⼀步的视觉观测,首先需要同时视觉语⾔编码器从中压缩出有效信息。 采用怎样的编码器,视觉和语 ...
「智元机器人」“攻入”科创板,30+家“智元链”企业梳理!
Robot猎场备忘录· 2025-07-12 04:54
温馨提示 : 点击下方图片,查看运营团队6月最新原创报告(共235页) 说明: 欢迎约稿、刊例合作、行业交流 , 行业交流记得先加入 知识星球"机器人头条" ,后添加( 微信号:lietou100w )微信; 若有侵权、改稿请联系编辑运营(微信:li_sir_2020); —— 正文: 随着[宇树科技]旗下人形机器人H1登录蛇年春晚,瞬间火爆海内外, 在资本市场、股票市场和人才市场受到各方关注,尤其是股票市场:继 T链 (特斯拉)、H链(华为)后,更是出现了宇树链。 至此, T链、H链和宇树链成为 人形机器人三大核心供应链 ,其次是影响力较弱的Figure链、智元链 等; 具身智能大火已两年, 但凡跟特斯拉Optimus、宇树科技等人形机器人企业相关的上游核心零部件上市公司都迎来数倍涨幅, 关注股市的朋友也肯定深有体会 。 2025年2月,摩根士丹利、高盛集团相继发布人形机器人相关研报,都一致认为上游核心供应链公司将在这波人形机器人浪潮中率先获利,并对上市 供应链公司进行详细梳理。 两份研报详细解读,查看往期文章: 深度解读「摩根士丹利」双研报:头部人形机器人、核心供应链公司梳理和投资分析(附报告) 深度解读 ...
中国特供车搁置、FSD难落地,特斯拉在华走下坡路了
Feng Huang Wang· 2025-07-07 04:34
凤凰网科技讯 北京时间7月7日,据《华尔街日报》报道,随着埃隆·马斯克(Elon Musk)在美国面临日益 严峻的商业和政治挑战,他在另一个最重要市场中国也遭遇了麻烦。 随着中国本土汽车制造商越来越受欢迎,特斯拉在华市场份额萎缩。中国消费者认为,特斯拉的车型越 来越乏味,与当地消费者的品味脱节。如今,中国设计的顶级电动汽车常常配备一些特斯拉不具备的功 能,比如多块可以观影和打游戏的大屏幕,可以冰镇饮料的车载冰箱以及可用于自拍的车内摄像头。 中国电池公司也取得了新的技术突破。比亚迪(002594)和宁德时代(300750)最近表示,他们已开发 出五分钟快速充电技术。 目前,许多中国消费者依然把特斯拉视为电动汽车先锋。中国也将特斯拉视为外资投资成功的典范,以 及推动中国绿色经济建设的有力伙伴。绿色经济聚焦可再生能源、电动汽车和电池等产业。 麻烦的是,特斯拉的全自动驾驶系统(FSD,中国官网称智能辅助驾驶系统)仍未获得中国监管部门的全 面批准。这项技术是特斯拉未来主导交通领域雄心的核心功能,同时也是中国企业竞相攻克的领域。 特斯拉反应迟缓 特斯拉中国员工表示,他们曾向总部表达过对公司车型日益老化的担忧,但他们的警告 ...
具身领域的目标导航到底是什么?主流算法盘点~
自动驾驶之心· 2025-07-04 10:27
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 目标驱动导航,赋予机器人自主完成导航目标 具身导航作为具身智能的核心领域,涉及语言理解、环境感知、路径规划三大技术支柱。目标驱动导航(Goal-Oriented Navigation)通过赋予机器人自主决策能 力,是具身导航中最具代表性的方向。 目标驱动导航要求智能体在陌生的三维环境中,仅凭目标描述(如坐标、图片、自然语言)等,即可自主完成环境探索与 路径规划。 与传统视觉语言导航(VLN)依赖显式指令不同,目标驱动导航系统需要实现从"听懂指令走对路"到"看懂世界自己找路"的跃迁:当人类下达"去厨房拿可乐"的指 令时,机器人需自主完成语义解析(识别厨房空间特征与可乐视觉属性)、环境建模(构建家居场景的空间拓扑)以及动态决策(避开移动的人类或宠物),这 背后凝聚着计算机视觉、强化学习与3D语义理解的交叉突破。 目标驱动导航技术已在多个垂直领域实现产业化落地。在终端配送场景中,该技术与社交导航算法结合,使机器人具备应对动态环境和人际交互的能力:美团无 人配送车通过动态路径重规划在复杂城市环境中执行递送任务,Sta ...
传统导航和具身目标导航到底有啥区别?
具身智能之心· 2025-07-04 09:48
点击下方 卡片 ,关注" 具身智能 之心 "公众号 说到机器人导航,技术路线已经逐渐从早期传统的建图定位导航,到后期基于大模型方案的导航演变。而 基于大模型方案的导航又分为视觉语言导航和目标导航! 策略网络的学习过去集中在如何从标注的数据集中提取模式,数据增⼴在其中起到了关键作用。如今, LLM拥有了强大的先验知识,如何从中蒸馏有效的规划信息,成为了近期研究的热点。 再来看看目标导航 VLN更进⼀步,是目标导航任务(Object Navigation),目标导航要求智能体在陌生的三维环境中,仅凭目 标描述(如坐标、图片、自然语言)等,即可自主完成环境探索与路径规划。 如果说一句话说明这两个任务的区别,视觉语言导航是""听懂指令走对路",目标导航是""看懂世界自己找 路"。 视觉语言导航是什么? 视觉语言导航本质上是个指令跟随的任务。任务囊括了三个方面,理解语⾔指令、感知周围环境,规划运 动策略。一般来说,VLN机器人系统主要由视觉语言编码器,环境历史信息表征,以及动作策略三个模块 构成。 机器人从环境中获取语⾔指令和每⼀步的视觉观测,首先需要同时视觉语⾔编码器从中压缩出有效信息。 采用怎样的编码器,视觉和语言 ...
超百亿融资,全球人形机器人交流纪要(H1)
Robot猎场备忘录· 2025-07-04 09:45
温馨提示 : 点击下方图片,查看运营团队6月最新原创报告(共235页) 正文: 全球大厂入局具身智能赛道典型代表:最强"卖铲人"[英伟达]和人形机器人赛道"引领者"[特斯拉],随着双方创始 人黄仁勋和马斯克在CES2025大会期间先后宣布人形机器人时代即将到来,正式开启 具身智能赛道在2025年火 爆局面。 目前2025年上半年已结束,全球具身智能赛道创企们迎来新一波融资潮流, 大额融资不断, 单轮融资屡创新 高,估值也水涨船高;同时, 以汽车主机厂为代表的产业派和互联网、电子商务、消费电子等为代表科技大厂也 纷纷组建自研团队 , 下场"造人"。 随着诸多人形机器人创企宣布量产消息,目前行业基调是,创企们生产出人形机器人本体并不难,通过战略合 作、实现营收也不难,技术突破和场景探索才是关键;具身智能赛道发展至今,软硬件皆没有收敛,作为核心瓶 颈的机器人"大脑"短时间更是难以突破,现阶段 谈 人形机器人实现真正有效的商业化仍旧为时尚早。 全球人形机器人企业们 受困于商业化,但机器人上游核心零部件厂商已率先获利, 人形机器人三大核心供应链T 链(特斯拉)、H链(华为)和宇树链,其次是智元链、Figure AI链等 ...
雷军:着急用车可考虑小鹏理想Model Y,拦截YU7大可不必;李想首次回应发飙事件,承认自己脾气大;正浩CTO离职,或将创业
雷峰网· 2025-07-03 00:40
要闻提示 NEWS REMIND 1.李想首次回应发飙事件:因当时有人弄虚作假,承认自己脾气大 2.蔚来李斌谈产业升级:以前做车能卖20万就感觉突破了天花板,现在ET9能卖80万 3.正浩CTO陈熙离职,或将创业 4 . 雷军:着急用车可考虑小鹏理想Model Y,拦截YU7大可不必 5 . 荣耀高管谈上市进展:IPO辅导目前很顺利,稳步推进中 6.哪吒汽车关联公司20亿股权遭二次冻结,母公司进入破产重整程序 7.曝iPhone 18系列升级2nm芯片:苹果迈入2nm时代 8.传Intel CEO陈立武考虑放弃推销18A工艺!全力发展Intel 14A 今日头条 HEADLINE NEWS 李想首次回应发飙事件:因当时有人弄虚作假,承认自己脾气大 7月2日,在最新一期《对话》栏目预告中,理想汽车创始人李想称,描述他最准的一个词是"脾气大"。主 持人提到,李想曾在节目中发过一次"著名的脾气",李想回应称:"当时发飙是因为有人在弄虚作假,节 目把后面的话剪掉了。"李想还透露,自己发脾气总共有三种状况:第一种状况是表达一个东西毫无逻 辑;第二种是要求太低,大家得过且过;三是做的事情违背了公司的价值观。 据报道,李想 ...
晚点独家丨2 年半,字节造出千台机器人,长期目标是具身智能
晚点LatePost· 2025-07-02 13:14
目前量产形态为轮式物流机器人,客户有抖音电商、比亚迪、顺丰等。 文 丨 张家豪 编辑 丨 程曼祺 2023 年 7 月,《晚点 LatePost》 曾独家披露 ,字节 AI Lab 旗下机器人团队正推进机器人量 产。当时曾定下到 2023 年年底,量产 200 台的目标。 现在,据我们了解,字节开发的机器人已累计量产超千台。他们在 2023 年完成了 200 台量产 目标,之后年量产数超 100% 增长。该机器人研发团队,也从 2023 年夏天的约 50 人左右,扩 充至目前的约 150 人。 目前字节已量产的机器人形态是轮式物流机器人,或称自主移动机器人(AMR,Autonomous Mobile Robot),没有用于分拣的机械臂,主要用途是在仓库、产线上运输包裹与零件,能自 主学习、规划路线、移动到目的地。据我们了解,字节的物流机器人,目前主要服务于抖音电 商仓等字节自己的业务,同时也已拿下一些外部客户,如顺丰、比亚迪电子,在生产基地内运 输零件与加工好的商品。 这是非常成熟的机器人应用场景,亚马逊在 2012 年就收购 Kiva 机器人用于自己的物流中心。但早期 轮式物流机器人需要读取地面二维码,只能 ...
机器人导航的2个模块:视觉语言导航和目标导航有什么区别?
具身智能之心· 2025-07-02 10:18
点击下方 卡片 ,关注" 具身智能 之心 "公众号 说到机器人导航,技术路线已经逐渐从早期传统的建图定位导航,到后期基于大模型方案的导航演变。而 基于大模型方案的导航又分为视觉语言导航和目标导航! 如果说一句话说明这两个任务的区别,视觉语言导航是""听懂指令走对路",目标导航是""看懂世界自己找 路"。 视觉语言导航是什么? 视觉语言导航本质上是个指令跟随的任务。任务囊括了三个方面,理解语⾔指令、感知周围环境,规划运 动策略。一般来说,VLN机器人系统主要由视觉语言编码器,环境历史信息表征,以及动作策略三个模块 构成。 机器人从环境中获取语⾔指令和每⼀步的视觉观测,首先需要同时视觉语⾔编码器从中压缩出有效信息。 采用怎样的编码器,视觉和语言的表征是否应该投影到⼀个共同的表征空间,是否应该首先对语言指令在 指令级别的拆分然后在压缩是其中的关键问题。这其中,采用在大规模数据集上预训练的视觉语⾔模型, 利用LLM做指令拆解和任务拆分是目前主流且前沿的范式。 VLN机器⼈需要逐步获得视觉观测,执行动作,获得新的观测,以此循环,这天然是⼀个序列决策的任 务。那么如何累积历史上获得的信息,判断当前执行到任务的哪个阶段,为 ...
曝马斯克已放弃殖民火星计划 原计划于2028年登陆
Sou Hu Cai Jing· 2025-07-01 08:49
然而,现实似乎并不如预期般顺利。2025年6月18日,SpaceX的"星舰"火箭遭遇故障并发生爆炸,这无 疑给其太空探索计划带来了重大挫折。尽管遇到了这样的困难,马斯克及其团队仍然努力推进着他们的 目标,直到最近有关放弃火星殖民政治愿景的消息传出。 马斯克曾多次强调火星殖民的重要性,认为这对于确保地球遭受严重灾难时文明能够延续至关重要。他 曾表示,希望能在2028年实现人类登陆火星的梦想。但是,随着技术挑战的增加和个人愿景的变化,马 斯克似乎调整了他的长期规划,将重点转向了其他可能更具实现可能性的目标。 作为马斯克朋友的硅谷知名投资人彼得·蒂尔在采访中透露,马斯克不再认为火星殖民是一个可行的方 案,可以帮助人类建立新的社会体系。蒂尔指出,"2024年是埃隆不再相信火星的一年"。尽管如此,马 斯克对人类星际扩张的兴趣并未完全消失,但这一兴趣如今更多地停留在科技层面。 回顾马斯克的火星探索历程,早在2001年,他就萌生了移民火星的想法。到了2011年至2017年间, SpaceX提出了"红舰"概念,随后在2017年被更为先进的星舰计划所取代。2025年5月30日,马斯克在一 个公开演讲中宣布,SpaceX计划于2 ...