世界模型
Search documents
不装了,LeCun哈萨比斯神仙吵架,马斯克也站队了
3 6 Ke· 2025-12-24 07:47
Core Argument - The debate centers around the essence of intelligence, with Yann LeCun arguing against the concept of "general intelligence," while Demis Hassabis defends its existence and potential [6][8][12]. Group 1: Key Perspectives - LeCun claims that human intelligence is not "general" but rather a specialized adaptation to the physical world, emphasizing that humans excel in certain areas while failing in others [6][8][14]. - Hassabis counters that the human brain is the most complex known entity in the universe, possessing significant generality, and argues that the concept of general intelligence is valid and essential for understanding cognitive capabilities [9][10][12]. - The disagreement highlights a fundamental difference in their views: LeCun focuses on what intelligence is, while Hassabis emphasizes what intelligence can become [20]. Group 2: World Models - Both LeCun and Hassabis agree on the importance of "world models" in achieving artificial general intelligence (AGI), although they have different interpretations of what a world model entails [20][22]. - LeCun's upcoming venture, Advanced Machine Intelligence Labs, aims to develop world models that focus on control theory and cognitive science, rather than just visual representation [20][21]. - Hassabis has introduced the Genie 3 model, which aims to understand the causal relationships and interactions within the world, viewing it as a step towards AGI [21][22].
不装了!LeCun哈萨比斯神仙吵架,马斯克也站队了
量子位· 2025-12-24 05:14
一水 发自 凹非寺 量子位 | 公众号 QbitAI 吵起来了。 图灵奖得主和诺贝尔奖得主,为了"智能的本质"——直接激情友好地交流上了。 AI三巨头之一、图灵奖得主Yann LeCun明确表示: 纯粹就是胡扯(complete BS)。 而诺贝尔奖得主、谷歌DeepMind CEO哈萨比斯也不留情面了,指名道姓回击: 马斯克也跑来吃瓜了—— 没有任何多余的解释,但这波他站哈萨比斯——"Demis is right"。 LeCun的说法简直是大错特错。 论战之激烈,关注度之高,已经让专门开辟了一个话题板块: 当然,马斯克的站队可能也有别的原因。毕竟他和LeCun素来不是很对付,跟哈萨比斯则亦师亦友——马斯克还是哈萨比斯DeepMind早期投 资人。 要科学吃瓜,可能还是要知道他们究竟在激辩什么? 争论焦点:智能的本质是什么? 事情还要从LeCun几天前接受的一场采访说起。 他在节目中言辞犀利地指出: 根本不存在所谓的"通用智能",纯粹就是胡扯(complete BS) 。 然而,这一观点很快遭到了哈萨比斯的直接回怼。哈萨比斯表示: LeCun的说法简直是大错特错。 他这是把"general intellige ...
刷完英伟达今年所有的项目后,我们推荐这几个......
自动驾驶之心· 2025-12-24 03:29
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 这两年AI吸引着全世界的眼光,而英伟达无疑是所有目光中的焦点。这家为AI时代提供基础设施的科技巨头,在10月底成为人类历史上第一家5万亿美元市值的公 司,比三年前翻了11倍。 成立于93年的英伟达,已经完成了从图形芯片到AI巨头的演进之路。三十多年的发展过程中有几个关键的节点:1999年推出GeForce 256,2006年CUDA问世,2012年 支持AlexNet,2020年开始发布高端计算GPU,21年开始发布端侧芯片(ORIN/Thor)。 毫无疑问,英伟达是AI基础设施的第一巨头。但在这背后,英伟达的野心不只局限于做一下硬件公司。一个非常明显的信号是, 今年英伟达在自动驾驶、具身智能、 大模型和世界模型几个最热的AI赛道上产出了多篇重量级工作 ,引起了业内的广泛讨论。今天自动驾驶之心就带大家盘点一下2025年英伟达的技术图鉴,主要有以下 几个系列: 今天盘点的主要是英伟达主导的工作,并未涉及英伟达参与的其他工作。更多关于英伟达的技术解析、发展趋势和 ...
深度解析世界模型嵌入具身系统的三大技术范式
具身智能之心· 2025-12-24 00:25
编辑丨 机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 长期以来,具身智能系统主要依赖「感知 - 行动」的反应式回路,缺乏对未来的预测能力。而世界模型的引入,让智能体拥有了「想象」未来的能力。 具身智能机器人通过世界模型想象抓杯子任务 那么关键问题来了: 世界模型应该如何「放进」具身系统中?是作为一个独立的模拟器?还是作为策略网络的一部分? 近日,依托 北京中关村学院 , 来自 中科大、哈工大、南开大学、清华大学、宁波东方 理工大 学 等机构的研究团队发布了一篇全面综述,首次从架构集成 (Architectural Integration) 的视角,将现有研究划分为三大范式。 本文将带你一览这篇硬核综述的核心精华。 论文标题: Integrating World Models into Vision Language Action and Navigation: A Comprehensive Survey 原文链接: https://doi.or ...
7000亿豪赌,扎克伯格买了众叛亲离
创业邦· 2025-12-23 10:51
Core Viewpoint - 2025 is expected to be a tumultuous year for Meta, with significant internal challenges and strategic shifts in its AI initiatives [3][4]. Group 1: AI Strategy and Developments - Meta is aggressively pursuing AI advancements, restructuring its AI department around the Meta Superintelligence Labs (MSL) and investing hundreds of billions to compete with rivals like OpenAI and Google [5][6]. - The company is developing new AI models, "Mango" for image and video generation and "Avocado" for advanced code generation, with a planned release in 2026 [12][19]. - Internal issues have plagued the development of the Llama 4 model, which has underperformed and faced multiple delays, leading to concerns about Meta's AI capabilities [16][19]. Group 2: Leadership and Internal Dynamics - CEO Mark Zuckerberg's management style has shifted towards micromanagement, causing internal chaos and dissatisfaction among employees, including key figures like Alexandr Wang [10][31]. - Wang, who was brought in to lead AI initiatives, has expressed frustration over Zuckerberg's tight control, which he believes stifles innovation [31][32]. - The company has seen a wave of executive departures, including long-standing leaders and key AI talent, raising concerns about its internal stability and future direction [40][41]. Group 3: Financial Commitments and Future Outlook - Meta's capital expenditures are projected to reach at least $70 billion in 2025, significantly higher than the previous year's $39 billion, as the company invests heavily in AI infrastructure [48]. - The company has issued a $30 billion corporate bond, one of the largest in U.S. history, to fund its AI initiatives and maintain a competitive edge [53]. - Despite substantial investments, there is uncertainty regarding how Meta will monetize its AI developments, with calls for clearer strategies on integrating AI into its existing business model [57][58].
聊天机器人只是过客?谷歌押注“世界模型”,寄希望智能眼镜成为AI真正“杀手级”应用
Hua Er Jie Jian Wen· 2025-12-23 10:30
Core Insights - Google is shifting its AI strategy towards "world models" to surpass the current chatbot paradigm, aiming for a qualitative leap in AI technology [1] - The company plans to launch new AI smart glasses in 2026, developed in collaboration with Samsung, which will differentiate itself from competitors by understanding three-dimensional space and physical object relationships [1][2] - The success of these smart glasses could signify a transition in AI applications from language processing to physical world interaction, impacting Google's hardware business and defining the next era under CEO Demis Hassabis [2] Group 1: Strategic Shift - Google is not solely focused on large language models (LLMs) as a path to artificial general intelligence (AGI), but is investing in "world models" that simulate and understand physical environments [3] - This strategic divergence is evident as Google balances investments in existing chatbot technologies while also pursuing potentially paradigm-shifting innovations [3] Group 2: Organizational Changes - In 2023, Alphabet CEO Sundar Pichai merged two major AI departments under Hassabis's leadership to enhance collaboration and efficiency [4] - The return of Noam Shazeer, a co-inventor of the Transformer architecture, has been pivotal in improving the Gemini model's performance, which has surpassed ChatGPT in benchmarks [4] Group 3: Commercialization Challenges - Despite the success of Gemini, Google faces significant commercialization pressures, needing to prove its AI technology can generate revenue beyond advertising [7] - The upcoming smart glasses are expected to feature lens displays for navigation and translation, with capabilities to remember object locations and understand three-dimensional environments, setting them apart from Meta's offerings [7]
研报掘金丨中邮证券:维持昆仑万维“增持”评级,前瞻布局世界模型,持续关注AI算力芯片进展
Ge Long Hui A P P· 2025-12-23 06:29
中邮证券研报指出,昆仑万维(维权)前瞻布局世界模型,持续关注AI算力芯片进展。世界模型是一 类能够对现实世界环境进行仿真,并基于文本、图像、视频及运动等多模态输入生成视频、预测未来状 态的生成式人工智能模型。2025年8月,公司进一步打造并开源Matrix-3D,其可实现从单图像生成可漫 游的高质量三维场景,适用于游戏、影视、虚拟现实及具身智能等多个领域。目前Matrix-3D已在多个 评估指标上优于360DVD、Imagine360、GenEx等主流模型,并取得全景视频生成任务的SOTA成绩,技 术稀缺性与领先性凸显。公司持续迭代AI产品,多款产品保持行业领先,后续伴随产品落地,有望形 成新增长动能。以12月19日收盘价计算,对应PE分别为-114/3951/183倍,维持"增持"评级。 ...
机器人学习现状!PI团队内部员工分享(从数采到VLA再到RL)
具身智能之心· 2025-12-23 00:03
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨 具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多VLA与RL实战项目,欢迎加入国内首个工业级VLA实战课程 : 具身VLA实战与求职教程来啦~ 。 这次来学习一下 PI 内部人员写的 blog,介绍了很多 robot learning 的现状,而且都是一线的真正经验,很多在一线的同学应该深有感触,说了很多实话,质量很 高,值的精读和学习。不管是对 IL DAgger RL 的看法都是很一手的经验。 接下来请享受这份知识 基本上,目前(2025 年 12 月)所有机器人学习系统都是纯粹的行为克隆(BC,也称模仿学习)系统。人类提供(接近)最优的任务演示,机器学习模型则尝试模 仿这些动作。形式上,策略训练采用监督式方法——给定机器人的状态 (例如摄像头图像、机器人关节角度以及可能的任务描述文本),policy 预测已演示的动作 a 通常是一个动作片段(action chunk),例如接下来约 50Hz 的 1 秒动 作)。 本文档旨在描述现代生物认知技术栈的构成,以及其不足之处和(不完整/笨拙的)变通方 ...
智能驾驶行业专题:Robo-X的产业趋势、市场空间和产业链拆解
2025-12-22 15:47
智能驾驶行业专题:Robo-X 的产业趋势、市场空间和产 业链拆解 20251222 摘要 L4 级自动驾驶市场潜力巨大,预计 2030 年全球市场空间达万亿级别, 国内 Robot Taxi 和 Robot Van 潜在替代市场规模分别为 2,360 亿元 和 1,645 亿元,无人卡车、公交车和环卫车等细分赛道亦具潜力。 全球多地政府放宽自动驾驶限制,明确监管框架,推动智能驾驶发展。 中国北京、上海、广州、深圳等城市已开启 ROS 服务,武汉、重庆等城 市也在开放相关服务。 强化学习和世界模型是 L4 级自动驾驶底层技术,解决了传统模仿学习的 数据稀缺和模块依赖问题,提高了系统泛化决策能力,有效应对辅助驾 驶需要改进的重要场景。 Robotaxi 运营成本优势显著,无安全员情况下每公里运营成本仅 0.81 元,低于传统燃油和电动网约车。当运营车辆规模达 1,000 台时,有望 实现营业利润转正。 Robotaxi 商业模式多样,主机厂、自动驾驶公司和出行服务商合作是 主流。国内外企业加速布局,如特斯拉已在德州上线无人驾驶出租车, 累计行程超 40 万公里。 Q&A 目前 ROS 行业的整体趋势和市场空间如 ...
赵何娟对话张宏江:世界模型已是兵家必争之地|2025 T-EDGE全球对话
Tai Mei Ti A P P· 2025-12-22 14:52
频对话截图 最近在硅谷有两家初创公司,是由一些非常强的人创办的世界模型和AI科学家公司,人还没有到齐, 公司网站还没有正式上线,其估值就已经到了40亿、50亿美元。 在张宏江看来,很重要的一点就是人们对于世界模型或下一代模型还是有着非常高的期望,所以人们会 下这种重大的赌注。 对于这些新成立的大模型初创公司,张宏江指出,"他们没有放弃模型,模型本身就是兵家必争之地, 但是他们并不是去重复竞争,而是在寻找新的突破口。这个突破口就是世界模型,很可能是类似这个 AI科学家这样的模型。" 12月17日,在钛媒体2025 T-EDGE全球对话中,「赵何娟 Talk」(Jany Talk)进行了一场意义非凡的关 于AI的对话。这次邀请的嘉宾是源码资本投资合伙人、美国国家工程院院士张宏江。 ChatGPT发布三周年,以"大模型'拐点'之年,AI下一个十年看什么"为主题,赵何娟与张宏江再次进行 了一场关于AI的深度对话。在这次对话中,张宏江指出,今天超级智能的出现,是人类第一次见证, 一个技术革命最终会消灭工作。 而针对Open AI联合创始人、前首席科学家、"ChatGPT之父"伊利亚·苏茨克韦尔(Ilya Sutskev ...