Workflow
理想TOP2
icon
Search documents
理想新一代世界模型首次实现实时场景编辑与VLA协同规划
理想TOP2· 2025-06-11 02:59
以下文章来源于自动驾驶之心 ,作者Anthony Chen等 自动驾驶之心 . 在TOP2 翻阅的数十篇理想论文中,这是第一次论文作者出现了非大陆拼音名,分别为Anthony Chen和Kurt Keutzer。 论文核心4点突破: 几何条件驱动:用3D渲染替代数值控制信号,解决动作漂移问题。 动态编辑机制:在静态点云中注入可控运动,平衡效率与灵活性。 最小化训练代价:冻结主干模型 + 轻量化适配器,实现数据高效训练。 自动驾驶开发者社区,关注自动驾驶、计算机视觉、感知融合、BEV、部署落地、定位规控、领域方案等,坚持为领域输出最前沿的技术方向! 2025年5月28日北大&理想&伯克利 发布GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control。 Anthony Chen,Wenzhao Zheng, Yida Wang为同等贡献,Shanghang Zhang为通讯作者。 Anthony Chen同时是北大和理想的,Wenzhao Zheng是伯克利的,Yida Wang 是理想的。Shanghang Zh ...
理想产品经理回应25款焕新版为何取消电容方向盘
理想TOP2· 2025-06-10 10:31
省流版来自微博用户有理想的Chan 25款焕新版确实取消了电容方向盘 回答一下大家特别关注的关于「电容方向盘」的问题。 Q:25款焕新版是否取消了电容方向盘? A:是的。 Q:什么是电容方向盘?电 容方向盘的作用是什么? A:在方向盘上布置了电容传感器,当人手接触方向盘时会产生电容 变化。通过电容变化判断是否手握方向盘,作为驾驶员使用辅助驾驶时注意力是否集中的依据,也就 是DMS(驾驶员监测系统)的重要信息输入。 Q:为什么需要驾驶员注意力检测系统? A:避免使用辅助驾驶时出现滥用情况,引发安全问题。历史经验表明总有滥用辅助驾驶的同学,在 开启辅助驾驶后开始了睡觉、玩儿手机等一系列不安全的驾驶行为,这时候有一个系统来检测不安全 行为就显得格外重要了,如果开车不认真就禁止使用辅助驾驶,即是保护车主自己安全也是保护道路 上其他交通参与者安全。 Q:驾驶员注意力监测的技术方案有哪些? A: ①扭矩检测,通过转动方向盘,系统检测到有力产生。 ②电容检测,通过触摸方向盘方式,系统检测到电容变化。 电容方向盘是通过电容变化来判断咱们有没有手握方向盘的,算是驾驶员监测系统 (DMS)的重要 "小眼睛"~ 为啥需要监测注意力 ...
理想超充站2428座|截至25年6月8日
理想TOP2· 2025-06-09 07:56
Group 1 - The core viewpoint of the article highlights the progress in the construction of supercharging stations, with a total of 2,428 stations built, achieving 90.69% of the target for 2,500+ stations by the i8 release date [1] - The remaining time until the i8 release is 53 days, requiring an average of 1.36 new stations to be built daily to meet the target [1] - For the year-end goal of over 4,000 stations by 2025, the current progress stands at 30.84%, with 206 days left in the year, necessitating the construction of 7.63 stations per day [1] Group 2 - The newly constructed station is located in Shanghai, specifically in the Pudong New Area, and is categorized as a 4C station with specifications of 4C × 4 [1]
理想对流媒体后视镜是如何思考的?
理想TOP2· 2025-06-09 07:56
独立摄像头是800万像素的,"片源"清晰。 LCD屏幕也是高清的,分辨率和我们中控屏一样, PPI达到了212。 刷新帧率也达到了50帧每秒。 第二:视场角特别大, 120度,其他70度 80度的摄像头能看到3车道的时候,这块后视镜可以看到5车道,几乎没有视野盲区了。 而且120°视野 角与人眼的主要视野一致,就跟最好的FPS游戏也必须采用120°一样,当人眼的视线在内后视镜和车风挡前方 道路切换,不会造成人眼的不适应。 第三:防眩目,防反光。 双重防眩目,摄像头防曝光,LCD 屏幕防眩目。 同时屏幕还专门做了防反光的设计,避免把车内的场景反光到LCD屏幕上。 但其 实,我们也不是一开始就是做出了这么一个流媒体后视镜的,中间也经历了无数的波折。有不少小故事,好 的产品其实并不是一蹴而就。 最开始,第一个问题是,到底要不要给L9单独做一块流媒体后视镜? 由于21寸屏幕的引入,当二排观影的时候,屏幕放下,物理后视镜就被全部遮挡了。 这个是真实的场 景,但是,到底要不要为此而就单独来做一块流媒体后视镜呢?因为毕竟要背很高的成本,到底有没有足够 的用户价值? 这里面其实是有很多不同意见的,很抱歉,我当时属于智能焕新版 ...
理想的VLA可以类比DeepSeek的MoE
理想TOP2· 2025-06-08 04:24
本文经过认真思考,有任何不同意见都可在评论区留言,我都会回复的。 看待一个东西的角度有非常多种,当一个人说XX可以和XX类比时,一般是某一个角度有相似之处, 任意两个事物不太可能所有细节都可以类比。 理想VLA和DeepSeek MoE( 混合专家 )类比点: VLA和MoE本身的想法都有其他人先提过了,都是首次完整落地到另一个大领域,在其中有大量创 新,并取得良好结果。 理想暂时还没有自己的MLA( 多头潜在注意力机制 ),之后会有的。DeepSeek的MLA创新尺度是这 个方法的理念之前没人提过。 DeepSeek之前的MoE,专家数量一般只有8-16个,单个专家需处理多种类型知识,专业化程度低,不 同专家重复学习相同公共知识,参数利用率低。 DeepSeek的MoE核心通过 Fine-Grained Expert Segmentation( 细粒度专家划分)和 Shared Expert Isolation( 共享专家隔离),处理方式和原来的MoE已经非常不同了。 前者将单个专家拆分为更小的子专家(原专家隐藏层维度缩小至 1/4,数量增至4倍),让激活专家 组合灵活性显著提升(从120种组合的数量级增至 ...
可以留意一下, 对理想同学玩偶IP好评率可能在快速上升
理想TOP2· 2025-06-07 14:13
从刻板印象维度,有可能女性和小孩会更容易喜欢。 根据李想 AI Talk 第一季的表态来看,李想可能有很大意愿学习泡泡玛特的精髓。 张小珺: 你是不是经常跟那泡泡玛特的王宁学做IP?你有学到什么方法论? 最近一段时间,在群里/线下交流过程中,TOP2留意到对理想同学玩偶IP好评率在快速提升,TOP2接 触到的大多数人是京津冀/长三角/珠三角/成渝地区28-50岁左右的男性,最近接触到了多位35-45年龄 段的男性对理想同学玩偶IP好评。 张小珺: 你多久见他一次? 李想: 嗯,没准。有的时候很长时间不见,有的时候两三个月见一次。 从这段对话里,可以看出李想至少有过多次和王宁交流泡泡玛特本质,李想认为 很多人想在书包上 挂一个拉布布,实际是想 通过这些东西来证明我是社群的一部分。 理想同学玩偶IP,有可能可以通过实体/车机/手机等形式共同塑造成一个社群认同共同体。 李想: 它每个阶段都是不一样的,它的每个阶段东西都会反映在它的产品品牌牌的升级方面。其实泡玛特做 的东西应该是给大家带来庆祝的,这那是它疫情发展的一个阶段,其实对我们的帮助其实也很大,其 实我们很多人不懂得分享,举个例子,我们发了不少年终奖,我们的同 ...
理想超充站2427座|截至25年6月7日
理想TOP2· 2025-06-07 14:13
加微信,进群深度交流理想长期基本面。不是车友群。 来源: 北北自律机 25年06月07日星期六 理想超充 3 新增。 超充建成数:2424→2427座 ———————————————————— 基于i8发布日期 2500+座目标 新增数进度值:90.17%→90.56% i8发布剩余54天(按7月31假 设) i8发布剩余时间进度值:74.41% 需每日 1.35 座,达到 i8发布 目标值 基于2025年底 4000+座目标 今年新增数进度值:30.66%→30.80% 今年剩余207天今年时间进度值:43.29% 需每日 7.60 座,达到年底目标值 【附】3 座新增建成 海南省 琼海市 琼海高铁站停车场 为城市枢纽4C站,规格:4C × 6 福建省 泉州市 泉州丰泽刺桐北拓 为城市4C站,规格:4C × 8 浙江省 杭州市 杭州千岛湖诺富特酒店 为城市景区4C站,规格:4C × 6 ...
理想司机Agent的一些细节
理想TOP2· 2025-06-06 15:24
:基于2D/3D 信息编码整合进模型后,Agent 具备理解道路标牌【例如,出口,上下坡道,左右 转,电梯口,不允许通行,区域B12345,ABCDEFGG区 etc】的能力,和语音交互感知【左右转,靠边停 车,掉个头,快点慢点,甚至给出先去A区再靠边,或者掉头后再去C区】的能力。简单指令场景依赖的是 本地的多模态LLM,复杂指令是Token化后上云大参量的LLM,将任务拆解后转换成顺序任务后在本地LLM 执行。 :具备自建关联点的能力【我这里为什么不说建地图而是建关联点】有就几个原因:首先更多的 是行车的关联结构,而并非记忆了精准的道路结构。因此车辆在调用这个关联点记忆很像人在地下车库开 车【大概要往哪个地方开,而并非是像Hd map 具有严格的驾驶轨迹限定】,换句话说,关联点建好后。理 论上,给Agent 需求后,会直接进行关联点分析,规划出一条最近的【可以符合通行逻辑】的地下/园区驾 驶轨迹。 当然现在他能力还有限,还是偶尔会出现开错路,然后触发掉头再开【对因为行车模型化 后,理论上可以触发无限制掉头,几乎不会卡死】 :具备感知推理能力,而且怀疑整个AD Max Agent 场景是将行车感知摄像头和泊车 ...
理想同学MindGPT-4o-Audio实时语音对话大模型发布
理想TOP2· 2025-06-06 15:24
理想实时语音对话大模型MindGPT-4o-Audio上线,作为全模态基座模型MindGPT-4o的预览preview版 本,MindGPT-4o-Audio是一款全双工、低延迟的语音端到端模型,可实现像人类一样"边听边说"的自 然对话,并在语音知识问答、多角色高表现力语音生成、多样风格控制、外部工具调用等方面表现突 出,达到了媲美人人对话的自然交互水平。 核心功能 目前,基于MindGPT-4o-Audio的理想同学已在理想车机及理想同学手机App全量上线。 1. 模型能力 1.1 整体算法方案 MindGPT-4o-Audio是一款级联式的语音端到端大模型,我们提出了感知-理解-生成的一体化端到端流式 生成架构实现全双工、低延迟的语音对话。其中: 在各项权威音频基准测试以及语言理解、逻辑推理、指令遵循等语言理解任务上,MindGPT-4o-Audio 已达到行业领先水平,在语音交互评测基准VoiceBench多类评测中均显著领先行业领先的同类模型。此 外,我们实验发现,业内主流的语音端到端模型一般会在提升语音交互能力的同时,造成语言交互能力 的大幅下降,MindGPT-4o-Audio通过训练策略的优化保 ...
理想超充站2424座|截至25年6月6日
理想TOP2· 2025-06-06 15:24
基于i8发布日期 2500+座目标 新增数进度值:89.65%→90.17% i8发布剩余55天(按7月31假设) i8发布剩余时间进度值:73.93% 需每日 1.38 座,达到 i8发布 目标值 基于2025年底4000+座目标 今年新增数进度值:30.49%→30.66% 今年剩余208天 今年时间进度值:43.01% 需每日 7.58 座, 达到年底目标值 【附】4 座新增建成 广东省 汕尾市 汕尾豪通车行北侧停车场 为城市4C站, 规格:4C × 6 山东省 济南市 济南槐荫汽车西站整备基地 为城市4C站,规格:4C × 6 天津市 东丽区 天津海月道 为城市4C站,规格:4C × 6 浙江省 宁波市 宁波新府银座 为城市4C 站,规格:4C × 8 加微信,进群深度交流理想长期基本面。不是车友群。 来源: 北北自律机 25年06月06日星期五 理想超充 4 新增。 超充建成数:2420→2424座 ———————————————————— ...