世界模型

Search documents
融资2.42亿美元,「智元」之后,又一家“华为系”具身智能机器人创企轰动资本圈
Robot猎场备忘录· 2025-07-10 11:18
正文: 温馨提示 : 点击下方图片,查看运营团队6月最新原创报告(共235页) 说明: 欢迎约稿、刊例合作、行业交流 , 行业交流记得先加入 知识星球"机器人头条" ,后添加( 微信号:lietou100w )微信; 若有侵权、改稿请联 系编辑运营(微信:li_sir_2020); 有关科技大厂入局具身赛道(大模型赋能、投资和自研)更多详细梳理、解读,已放到知识星球"机器人头 条"(点击后方链接,加入星球查看查看往期文章: 【 原创】多家顶尖科技大厂,进军人形 机器人整机制造 成立五个月,融资2.42亿美元, 继[智元机器人]后,"华为系"具身智能机器人创企【它石智航】 (TARS)轰动资本圈! 继今年3月25日完成 1.2亿美元 天使轮(首轮)融资后, 拥有 "华为车BU+百度IDG+清华+复旦"四重背景 的具身智能机器人领域创企【上海它石智航技术有限公司】(以下简称"它 石智航")于7月8日官宣完成 1.22亿美元 天使+轮融资,本轮融资由美团战投领投,钧山投资、碧鸿投 资、国汽投资、临港科创投、赛富投资基金、建发新兴投资共同跟投,老股东线性资本、 襄禾资本等追投;首轮融资由蓝驰创投、启 明创投共同领投, ...
学长让我最近多了解些技术栈,不然秋招难度比较大。。。。
自动驾驶之心· 2025-07-10 10:05
❝ 柱哥,我是今年要找工作的应届生,211的本硕。最近在一家小厂实习着,这不秋招也开始了吗,就打算看看岗位,发现现在市面上都是一些端到端、VLA、强化学 习、世界模型之类的岗位~ 自己的技术栈主要聚焦在多传感器融合、3D检测这种。我咨询了毕业的学长,他说实际每个公司做前沿方向的人很少的,现在公司是即希望你什么都懂,但实际干 活的时候可能还是做一些量产的工作,偏向于数据啊、检测、OCC之类的。 目前我也想快速的丰富自己的技术栈,不求把新方向完全搞懂吧,知道是怎么回事就可以,有没有快速可以补充技术方向基础的办法? 星主回答: 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 自动驾驶的技术更新实在是太快了,以前学BEV还可以找到不错的工作,现在就只能当做个基础的知识面,还需要你懂前沿的世界模型、扩散模型等等等等。可以说自动驾 驶算法工程师越来越往复合型人才的方向发展~ 最近有 知识星球 的小伙伴私聊我提问,估计也说出大多数26届求职伙伴的心声: 你学长说的很多!前沿的方向虽然很火,但量产的形式还不明确。各家公司都怕技术掉队,所以即希望招来的人懂一些新方向,又能实 ...
Meta发布40页报告,具身智能的下一步是「心智世界模型」:能听,能看,能理解,会共情
量子位· 2025-07-10 03:19
Core Insights - Meta is actively investing in talent acquisition, with a reported expenditure of $100 million to recruit personnel [1] - The company has released a comprehensive 40-page report focusing on embodied intelligence and the introduction of a "mental world model" alongside traditional physical world models [2][3] Group 1: World Models - The report emphasizes the importance of both physical and mental world models, with the latter focusing on psychological laws such as intentions, emotions, and social relationships [3][4] - The physical world model includes information about object properties, spatial relationships, dynamic changes in the environment, and causal relationships based on physical laws [8] - The mental world model encompasses goals, intentions, emotional states, social dynamics, and communication methods, which are crucial for understanding human behavior [8][10][15] Group 2: Implications for AI - To create intelligent agents that can collaborate effectively with humans, it is essential for these agents to learn and understand human psychological states [15][17] - The report outlines a dual learning system combining observational learning (System A) and action-based learning (System B) to enhance AI capabilities [23][28] - The integration of these systems aims to improve the efficiency of AI learning and its ability to adapt to dynamic environments [28][29] Group 3: Future Directions - Despite current limitations in the performance of mental world models, their potential in multi-agent collaboration is significant [30] - The mental world model can facilitate consensus among agents, allowing them to align goals and coordinate actions in uncertain environments [32] - This advancement represents a critical step towards more empathetic and context-aware human-machine interactions [33][34]
「世界模型」也被泼冷水了?邢波等人揭开五大「硬伤」,提出新范式
机器之心· 2025-07-09 07:10
机器之心报道 编辑:泽南、+0 现在的世界模型,值得批判。 我们知道,大语言模型(LLM)是通过预测对话的下一个单词的形式产生输出的。由此产生的对话、推理甚至创作能力已经接近人类智力水平。 但目前看起来,ChatGPT 等大模型与真正的 AGI 还有肉眼可见的差距。如果我们能够完美地模拟环境中每一个可能的未来,是否就可以创造出强大的 AI 了?回想 一下人类:与 ChatGPT 不同,人类的能力组成有具体技能、深度复杂能力的区分。 模拟推理的案例:一个人(可能是自私的)通过心理模拟多个可能结果来帮助一个哭泣的人。 人类可以执行广泛的复杂任务,所有这些任务都基于相同的人类大脑认知架构。是否存在一个人工智能系统也能完成所有这些任务呢? 论文:Critiques of World Models 论文链接:https://arxiv.org/abs/2507.05169 研究人员指出了构建、训练世界模型的五个重点方面:1)识别并准备包含目标世界信息的训练数据;2)采用一种通用表征空间来表示潜在世界状态,其含义可 能比直接观察到的数据更为丰富;3)设计能够有效对表征进行推理的架构;4)选择能正确指导模型训练的目标函数; ...
具身智能论文速递 | 强化学习、VLA、VLN、世界模型等~
具身智能之心· 2025-07-08 12:54
算法框架: 点击下方 卡片 ,关注" 具身智能 之心 "公众号 强化学习如何提升VLA泛化能力 清华大学、上海期智研究院、北京中关村科学院通过强化学习微调(PPO算法)显著提升视觉-语言-动作模 型(VLA)的泛化能力: 1)执行任务成功率提升42.6%(OOD场景) 2)语义理解任务成功率从61.5%提升至75.0%(未见物体) 3)动态干扰场景成功率从28.6%跃升至74.5%(Tab 3) 主要贡献: 论文标题:What Can RL Bring to VLA Generalization? An Empirical Study 论文链接:https://arxiv.org/pdf/2505.19789 1. 构建了一个严谨且具有挑战性的基准,用于评估 VLA 微调方法在视觉、语义和执行等不同维度上对泛 化能力的影响。 2. 确定 PPO 是优于 GRPO 和 DPO 的 VLA 微调 RL 算法,并讨论了将这些 RL 算法从 LLM/VLM 范式适 配到 VLA 独特需求时的关键挑战。 3. 开发了一种高效的基于 PPO 的 VLA 微调方案,该方案借助共享的 actor-critic 骨干网络、VL ...
蔚来自研神玑芯片落地:一次难而正确的长征
Zhong Guo Qi Che Bao Wang· 2025-07-08 09:19
6月底,搭载蔚来自研5nm车规工艺高阶智驾芯片「神玑NX9031」的旗舰轿车ET9,以及蔚来新ES6、EC6、ET5/ET5T系列车型,已全量接收 NT.Cedar/S"雪松"智驾系统的重大更新。这并非一次普通的OTA升级,其核心意义在于:蔚来自研硬件与自研软件首次实现了深度耦合,这也意味着中国 智能汽车产业在"芯片+操作系统+核心算法"的全栈技术链条上完成了关键闭环。 当竞争对手在"冰箱彩电"的舒适区贴身肉搏,当资本在价格战的泥潭中追逐短期回报,蔚来选择了一条截然不同的荆棘之路:将十年累计超600亿元 的研发投入和逾9900项全球专利,倾注于构建从芯片层、系统层到算法层的完整技术主权。某种程度上,这颗芯片可以说是蔚来十年造车路的缩影,这条 路径被广泛视为"难而正确",甚至在许多车企只存在于规划蓝图之上时,蔚来已率先打开未来的大门。其背后隐藏的是巨大的投入、漫长的周期与无数质 疑、不被理解的孤独。 荆棘密布的自研长征 选择自研高端智能驾驶芯片,无异于闯入一个全球顶尖科技巨头盘踞的角斗场。 2019年,特斯拉依托其HW系列芯片构筑了深厚的先发优势,2025年,特斯拉HW4.0硬件于中国大陆上市,下一代的HW5. ...
AI大模型行业专题解读
2025-07-07 00:51
GPT-5 在技术层面将进行多项升级。首先,它将在推理链条上进行优化,以提 高用户体验,减少回答的啰嗦和过于简单的问题。其次,GPT-5 将尝试将多个 相关模型以 agent 编排的形式合并,为用户提供更全能的使用体验。此外,在 多模态层面,GPT-5 将提升理解能力,这对于拓展 B 端业务尤为重要,因为生 成能力主要偏向娱乐层面,而理解能力在当前阶段对 B 端业务更为关键。参数 规模方面,GPT-5 预计会提升到 3 万亿至 4 万亿参数左右,并且推理性价比也 会有所提高。发布时间预计在 2025 年下半年,但也可能延迟到 2026 年春节 前。 OpenAI 如何应对 C 端市场竞争以及定价策略? OpenAI 在 C 端市场已经与其他公司拉开了巨大差距,因此压力较小。目前 OpenAI 正在积极拓展 B 端业务。在定价策略方面,尽管 GPT 的定价稳步提升, 但流量也在持续增长。同时,OpenAI 计划免费开放一些基础版功能,以继续 AI 大模型行业专题解读 20250706 摘要 GPT-5 预计在 2025 年下半年或 2026 年初发布,参数规模将提升至 3- 4 万亿,并优化推理链条,强调通用推 ...
资料汇总 | VLM-世界模型-端到端
自动驾驶之心· 2025-07-06 08:44
本文只做学术分享,如有侵权,联系删文 视觉大语言模型 综述汇总 基础理论 作者 | qian 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1922228114404143784 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 预训练 智能交通和自动驾驶中的 LLM:https://github.com/ge25nab/Awesome-VLM-AD-ITS AIGC 和 LLM:https://github.com/coderonion/awesome-llm-and-aigc 视觉语言模型综述:https://github.com/jingyi0000/VLM_survey 用于 CLIP 等视觉语言模型的出色提示 / 适配器学习方法:https://github.com/zhengli97/Awesome-Prompt- Adapter-Learning-for-VLMs LLM/VLM 推理论文列表,并附有代码:https://github.com/D ...
最新综述:从物理仿真和世界模型中学习具身智能
自动驾驶之心· 2025-07-05 13:41
以下文章来源于具身智能之心 ,作者Xiaoxiao Long等 具身智能之心 . 与世界交互,更进一步 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Xiaoxiao Long等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 出发点与工作背景 本综述聚焦具身智能在机器人研究中的前沿进展,指出实现强大具身智能的关键在于物理模拟器与世界模 型的整合。物理模拟器提供可控高保真环境用于训练评估机器人智能体,世界模型则赋予机器人环境内部 表征能力以支持预测规划与决策。 机器人的智能水平基于以下五个因素进行分级。 分类等级 文中系统回顾了相关最新进展,分析了两者在增强机器人自主性、适应性和泛化能力上的互补作用,探讨 了外部模拟与内部建模的相互作用以弥合模拟训练与现实部署的差距。此外,还提及维护了一个包含最新 文献和开源项目的资源库,网址为https://github.com/NJU3DV-LoongGroup/Embodied-World- ...
蔚来的硬寨,李斌的呆仗
汽车商业评论· 2025-07-02 05:50
撰 文 / 刘宝华 设 计 / 赵昊然 7月第一天,蔚来交出销量成绩单。 6月,公司三品牌总计交付新车24,925台,同比增长17.5%。二季度整体交付72,056台新车,环比一 季度大增71.2%,创下历史第二好成绩。 蔚来三品牌呈现出协同发力的良好态势。蔚来主品牌6月交付14,593台,继续担当销量主力;乐道 品牌交付6,400台,创今年月交付新高;firefly萤火虫品牌也交付3,932台,同样创下年内最佳表现。 截至目前,蔚来公司累计交付新车785,714台,其中蔚来品牌725,248台,乐道品牌52,623台,firefly 萤火虫品牌7,843台。这一数据验证了蔚来公司三个品牌不同定位的产品,正在各自细分市场逐步 站稳脚跟。 在多重挑战叠加之下,蔚来这份答卷的含金量尤为凸显。新能源汽车市场"价格战"空前惨烈,小米 SU7的强势入局更吸走了大量关注,环境异常残酷;同时,蔚来主销车型5566正处于产品切换关键 期;加之25Q1财报后遭遇密集恶意唱衰。 然而,蔚来前期投入的价值正加速兑现,成功顶住压力逆势而上,在这场硬仗中交出了一份韧性十 足的答卷,这样的表现在当前残酷的中国汽车市场大环境下显得格外珍贵 ...