Workflow
世界模型
icon
Search documents
AI智能涌现新阶段-智驾VLA与世界模型之争
2026-03-04 14:17
AI 智能涌现新阶段,智驾 VLA 与世界模型之争 20260304 智驾范式由"规则+地图"向"VLA+世界模型"演进,2025 年后进入 以 Deepseek 为代表的成本高效推理时代,核心在于通过强化学习提升 推理能力与人类偏好一致性。 模型参数规模持续跃迁,车端迈向数十亿级,云端向百亿级提升;小鹏 第二代 VLA 通过 32 倍超密视觉推理思维链,使预测误差降低约 33%, 实现视觉与语言原生多模态输入。 技术路径分化:华为、蔚来侧重"云端世界引擎+车端世界行动模型"; 小鹏、理想侧重 VOA 路线,将 LLM 嵌入支架算法内部以增强长尾场景 泛化力,解决外挂系统交互延迟问题。 训练范式从模仿学习转向"预训练+SFT+强化学习",通过结构化推理 (如 O1 长链思维)突破人类驾驶数据上限,解决紧急制动等场景下的 风险非对称性问题。 2026 年为关键催化时点:L2 强标预计 Q2 发布,线控制动/转向标准下 半年落地;外部催化包括特斯拉 Cybercab 量产及 FSD 入华,推动 L3/L4 商业化拐点临近。 投资聚焦冗余能力与国产替代:重点关注激光雷达(禾赛)、高阶智驾 芯片自主化(地平线)、Ro ...
李飞飞World Labs最新判断:AI写完代码,下一步是「写世界」?
机器之心· 2026-03-04 09:15
机器之心编辑部 AI 时代,我们已经习惯了用「说话」搞定一切:想要一个表格,动动嘴皮子,大模型分分钟就给生成出来;想完成个复杂任务,交代清楚目标和限制,「小 龙虾」自己就干活去了。 这个时代,只要会用语言,就能调动越来越复杂的系统。大模型之所以迅速渗透各行各业,本质上是因为它们踩在了「文本」这个成熟接口之上。 但当问题换成空间时,事情就没那么简单了。比如你想改一套房子的布局,或者给机器人一个新的仓库环境让它学会搬货,你不能只靠一句话反复「生成画 面」。如果每次移动一面墙、改变一盏灯,都要把整个世界从头渲染一遍,那效率和可靠性都会出问题。空间世界需要结构,需要持久存在的物体和规则, 就像程序需要代码,而不是每次都临时算一遍结果。 这篇来自 World Labs 的博客,讨论的正是这个问题: 当 AI 开始真正参与空间创作和现实世界任务时,什么才是它与人类、与其他系统沟通的「通用接 口」? 作者给出的答案是: 3D。 3D 不只是视觉效果,而是一种像代码一样的结构化表达。它可以被生成、被检查、被修改、被版本管理,也可以接入模 拟系统、机器人系统和现有的设计工具链。 围绕这个核心类比,文章进一步展开: 神经图形学像 ...
何小鹏赌约背后,中美智驾只剩“一年之差”
汽车商业评论· 2026-03-03 23:04
加入轩辕同学 , 成就新汽车人! 设计 | 甄 尤 美 撰文 | 常 笑 编辑 | 张 南 1903年,霍拉肖·杰克逊和苏厄尔·克罗克驾驶着简陋的汽车,在泥泞与荒野中挣扎了整整63天,终于从旧金山抵达纽约。彼时,这场驾车横穿美国 的艰难跋涉,只为向世界证明汽车不是"昙花一现的消遣玩物"。 时隔122年后,相似的路线被赋予了全新的意义。2025年底,历时2天零20个小时,跨越2732.4英里(约4397公里),坐在特斯拉Model 3里的大卫 ·摩斯,在全程无接管的情况下,达成了首次凭借智能驾驶技术横穿美国的壮举。 这场看似科幻的现实演绎,不仅是汽车工业的百年进阶,更是自动驾驶行业经历的一场跨越式变革。 刚刚过去的2025年,自动驾驶行业没有迎来所谓"技术终局"的大一统,反而陷入了更激烈的路线突围战。当单纯的端到端大模型遭遇长尾场景的 瓶颈,一场集体押注"认知智能"的竞速由此引爆,并一路烧至2026年。 在这场博弈中,各方角力的落点,都指向了同一个神秘代号——VLA(Vision-Language-Action,视觉-语言-动作模型)。 大洋彼岸,特斯拉在FSD V14版本引入类VLA多模态增强模块,通过增强逻 ...
中山大学HCP Lab联合拓元智慧提出高效世界模型DDP-WM,机器人规划效率提升9倍
机器之心· 2026-03-03 08:14
基于预训练视觉表征构建世界模型已成为具身智能领域的前沿研究方向。以 DINO-WM 为代表的先进研究成果表明,基于视觉 Transformer (ViT) 的架构 能够精确捕捉复杂的物理动态,并展现出强大的零样本规划能力。然而,这种不区分运动物体和静态背景、对所有图像块应用自注意力的密集计算范式导致 了高昂的计算开销,使得决策速度成为实际部署中一个巨大的挑战。 具体来说,目前最先进的此类模型 (DINO-WM) 在处理 Push-T 等典型操作任务时,其模型预测控制 (MPC) 的单个决策循环耗时高达 两分钟 。显然,这 种延迟对于需要与物理世界持续高频交互的现实场景应用而言是不可接受的,阻碍了机器人的大规模、低成本端侧设备部署。 近期,中山大学人机物智能融合实验室 (HCP Lab) 联合拓元智慧 X-Era AI 提出了一种新型的高效世界模型框架: DDP-WM (Disentangled Dynamics Prediction World Model)。 该框架的核心思想是解耦动态预测。通过一套系统化的设计,将计算资源精确分配给场景中不同属性的动态特性,从而在推理 速度大幅提升的同时,还能显著提升复杂操 ...
何小鹏:小鹏第二代VLA开启自动驾驶DeepSeek时刻;知情人士:鸿蒙智行已对违规营销门店进行处罚丨汽车交通日报
创业邦· 2026-03-02 10:05
1.【知情人士:鸿蒙智行已对违规营销门店进行处罚】记者从知情人士处获悉,鸿蒙智行已对"门店 短视频违规营销"事件做出处罚,包括责令涉事门店限期整改、扣除绩效分数及门店激励、要求经销 商对责任人进行经济处罚及问责等。同时,涉事两家鸿蒙智行门店已发布道歉声明,承认错误并接受 广大用户及社会公众的批评。此前有消息称,部分鸿蒙智行区域门店账号在网络平台发布营销视频 时,使用加速或倒放视频素材、违规营销。(财联社) 2.【小马智行:第七代Robotaxi于2026年2月在深圳实现月度单车运营盈利转正】3月2日,小马智 行宣布其第七代Robotaxi于2026年2月在深圳实现月度单车运营盈利转正。据小马智行介绍,截至2 月28日,第七代Robotaxi当月单车单日平均净收入达到338元,单车日均订单量达23单。(界面新 闻) 3.【 滴滴自动驾驶成立深穹远航实验室,携手清华大学开展前沿研究 】3月2日消息,滴滴自动驾驶 近期成立深穹远航实验室(DiDi Voyager Labs)。依托该实验室,滴滴自动驾驶率先与清华大学李 升波教授课题组达成产学研深度融合专项合作。双方将聚焦多模态大模型、世界模型、强化学习等前 沿方向, ...
对话九合王啸:90%具身智能公司没未来,市场名额只有三五家
量子位· 2026-03-02 09:09
田晏林 发自 凹非寺 量子位 | 公众号 QbitAI 2026年刚开局,具身智能赛道又涌入不少热钱。 资本喧嚣翻涌,真正够格给出专业判断、锚定长期趋势的投资人,屈指可数。 王啸是其中一位。 在人工智能尚未兴起的十余年前,他带着九合创投布局AI相关赛道。 投一流科技时,大模型底层框架还未成为行业焦点,而这家公司研发的OneFlow,后来成了世界首个面向大模型大数据的人工智能计算框 架,后被光年之外收购。 在具身智能还只是创投圈的小众话题时,他重仓 自变量机器人 ,现在成了国内唯一同时被字节、阿里、美团三家大厂投资的具身智能公司。 今年春晚亮相的 松延动力 ,王啸也是首批投资者之一。量子位见到王啸的当天,他刚刚跟姜哲源(松延动力创始人)开了碰头会。 如果你在黑暗中踩到一只猫,它是会叫的。 早些年,王啸这样形容自己捕捉机会时的直觉。 在成为这些具身智能项目的幕后推手之前,他更为人熟知的,是 百度创始团队 "七剑客" 的身份。他曾深度参与百度第一代搜索引擎的研 发,他的名字也成了一代互联网人的共同记忆。 因为有着绝对强的技术背景,在离开百度后,王啸成了风投圈里公认的"技术派"投资人。 自2011年成立九合创投,此后 ...
英伟达的下一个Mellanox-针对Agentic-AI底时延的Groq-LPU
2026-03-01 17:22
英伟达的下一个 Mellanox 针对 Agentic AI 底时延的 Groq LPU20260228 英伟达或将 Groq 的技术与工程团队吸收,将其 IP 融合进后续产品,而 非以独立产品线形式销售,此策略与 Mellanox 的收购路径一致,旨在 强化其在高性能计算领域的护城河。 Groq LPU 架构主要针对推理侧对极低时延的需求,尤其适用于 batch size=1 的场景,通过片上 SRAM 和确定性时序控制,实现更稳定的低 时延推理表现,与 GPU 在训练和较大 batch size 推理上的优势互补。 LPU 与英伟达 GPU 的整合预计至少需要 18-24 个月,可能在 Finman 那一代产品中实现,更可能采用 chiplet 封装级集成,通过混合键合和 TSV 技术实现 compute die 与 LPU die 之间更低时延的数据交互。 Finman compute die 可能采用台积电 A16 节点,而 LPU die 则可能 选择更成熟的 3nm 或 4nm 节点,以便更容易实现更高的 SRAM 配置 密度和 3D/堆叠式集成,作为第一代方案先行验证落地。 LPU 能力更可能整 ...
2亿美金留不住的华人天才,为何集体投奔OpenAI?
Xin Lang Cai Jing· 2026-02-27 10:11
(来源:科技头版) 硅谷不讲忠诚,只讲未来。 出品 | 科技头版 作者 | 刘峰 2026年的硅谷,没有岁月静好,只有硝烟弥漫。 最近,一则消息炸裂了美国科技圈:入职仅7个月的Meta"超人工智能实验室"AI基础设施负责人、身价高达2亿美金(约合人民币14.35亿元)的华人研究 员庞若鸣(Ruoming Pang),正式转投OpenAI。 这不仅是硅谷"最贵华人"的又一次跳槽,更是在短短一周内,继清华大神张鹏川之后,又一位从Meta FAIR出走的顶尖大脑。 为什么?为什么在扎克伯格挥舞着天价支票簿,在Meta豪掷千金组建"超级智能实验室"之际,那些站在金字塔尖的华人研究员,依然选择"弃船"? 一切,都隐藏在算力、薪酬和股权背后的硅谷新秩序中。 钱没给够?不,是平台比人才更重要 外界看到的是2亿美金的数字,看到的是庞若鸣放弃了在Meta的天价薪酬。但这背后,其实是一场关于人工智能研发主导权的残酷博弈。 庞若鸣是谁?他不是普通的算法调参师。翻开他的履历,你会发现这是一个典型的构建者。 上海交大本科毕业,普林斯顿博士,在谷歌深耕15年,联手打造了谷歌TPU上使用率最高的深度学习框架Lingvo,后来又去苹果负责基 ...
AI“世界模型”兵临城下,Unity中国要卖了?
Guo Ji Jin Rong Bao· 2026-02-26 13:49
Core Viewpoint - Unity Software is evaluating various options for its China business, including a potential sale, with a valuation target exceeding $1 billion [1] Group 1: Company Overview - Unity Software, founded in 2004, is a leading real-time 3D content creation and operation platform, widely used in video game development, virtual reality, augmented reality, and other fields [2] - Unity entered the Chinese market in 2012 and established a joint venture, Unity China, in August 2022, with investments from major local companies like Alibaba and ByteDance [2] Group 2: Product Development and Challenges - Unity China launched the "Unity Engine" to better adapt to local development needs, integrating with platforms like WeChat and Douyin [2] - The "Unity Engine" has faced criticism for being a stripped-down version of Unity 6, with fewer features and potential compatibility issues for developers [3] - Unity is under pressure from competitors like Epic Games' Unreal Engine and local engines like Cocos, which are expanding rapidly in the gaming market [3] Group 3: Financial Performance - For the fiscal year 2025, Unity reported revenues of $1.85 billion, a slight increase of 2.04% year-over-year, while narrowing its net loss from $664 million in 2024 to $403 million [5] - In Q4 2025, Unity achieved revenue of $503 million, exceeding market expectations, but the stock price fell over 25% due to conservative Q1 2026 guidance [8][9] Group 4: Market Reactions and Future Outlook - Following the news of a potential sale of its China business, Unity's stock rose by 1.59% [12] - The company faces significant challenges from AI advancements that could disrupt traditional game development, as highlighted by the introduction of new AI tools by competitors [11][12]
未知机构:人形机器人市场新信息汇总260224注以下信息为市场传-20260225
未知机构· 2026-02-25 03:40
【人形机器人】市场新信息汇总260224 注:以下信息为市场传言汇总,未经二次加工,不代表个人观点,不构成投资建议,请谨慎参考。 1、主流标的 【维宏股份】子公司汉姆电子为宇树零巧手电机供应商,高ASP。 汉姆董事长目前仍在北美,节后特斯拉进展,国产头部零巧手客户合作等催化值得期待。 【维宏股份】子公司汉姆电子为宇树零巧手电机供应商,高ASP。 汉姆董事长目前仍在北美,节后特斯拉进展,国产头部零巧手客户合作等催化值得期待。 【凯众股份】新能源车TPU结构件龙头,切入T机器人缓震结构件、足部总成、手套;主业含并购2亿利润,T链市 值最小、弹性最大。 已为小鹏、智元、YS累计提供近万套产品。 【科达利】谐波环节最强势的进攻方,有望成为贝塔时代、V4时代的核心供应商。 【万向钱潮】T机器人轴承/新型万向节核心供应商,格局最优;量产单机ASP 1万元;新增轻量化骨架,ASP提升 15%。 机器人轴承已覆盖国内主要本体企业。 【凯众股份】新能源车TPU结构件龙头,切入 【人形机器人】市场新信息汇总260224 注:以下信息为市场传言汇总,未经二次加工,不代表个人观点,不构成投资建议,请谨慎参考。 1、主流标的 【模塑科 ...