世界模型

Search documents
烧钱一年,李飞飞的「空间智能」愿景有变化吗?
机器之心· 2025-06-13 12:02
01. 创业一年后,李飞飞如何阐述 World Labs 的愿景? 成立一年的World Labs 发布过什么进展?World Labs 的愿景有变化吗?空间智能终于有望解锁了?... 02 . 为什么没有空间智能的 AI 是不完整的? 本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。 在近期由 a16z 普通合伙人 Erik Torenberg 主持的一场访谈中,李飞飞和 World Labs 早期投资者 Martin Casado 围绕「世界模型」和「空间智能」的话题探讨了她对 AI 技术的理解,并在创业 项目 启动一年后重新 介绍了 World Labs 的任务和愿景。 目录 2、李飞飞指出当前语言模型在描述和理解三维物理世界方面存在明显的局限性,空间智能则超越语言模型成 为智能的关键组件,是世界模型理解、重建和生成物理世界的核心能力。 ① 语言虽然是思想和信息的强大编码,但对 3D 物理世界而言是「有损的编码方式」,无法有效描述和操作三 维空间。而空间智能代表着更为古老和根本的智能形式,是 AI 的关键组成部分。 3、在这一认知框架下,World Labs 试图构建能理解 ...
凭借RCE和AI两把利器,广汽丰田开启中国自研2.0时代
Zhong Guo Qi Che Bao Wang· 2025-06-13 02:47
6月12日,广汽丰田在本厂举办了2025科技日活动,集中展示了通过全面运用人工智能(AI)技术,充分运用中国本土优势资源,打造领先的富有魅力 的产品阵容,争取到2030年智能电动汽车产销量达到80%的技术发展规划。 "当家花旦"换代也由中国工程师主导研发 铂智3X供不应求、近期连续两个月月销量蝉联合资车企智能电动汽车销量第一名的业绩,大大坚定了丰田总部和广汽丰田按照现有发展模式走下去的 信心。这个模式就是现地首席工程师(RCE,Regional-Chief Engineer )制度、大量引入中国本土智能化和电动化供应商,以及全面运用AI赋能。 现地首席工程师制度,就是由广汽丰田的中方工程师在继承丰田产品QDR(高品质、高可靠性和高耐久性)和一流安全性基因的前提下主导广丰产品 的研发工作。丰田智能电动汽车研发中心(中国)有限公司总经理小西良树在发布会上说,今年2月,丰田总部已作出决定,广汽丰田智能电动产品的开发 决策权将由日本移交给中国,RCE将主导包括全新车型、改款车型和换代车型在内的所有车型,这其中就包括全新一代赛那、汉兰达和凯美瑞的换代研发; 全新一代汉兰达和赛那即将展开大型化、增程化升级工作。 广汽丰田 ...
AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need
机器之心· 2025-06-13 02:32
机器之心报道 编辑:泽南、Panda 越通用,就越World Models。 我们知道,大模型技术爆发的原点可能在谷歌一篇名为《Attention is All You Need》的论文上。 如今,在通用人工智能(AGI)初现曙光,Scaling Laws 却疑似接近极限的当口,又是谷歌对未来方向进行了一番思考,想来想去还是只有五个词: 论文标题:General agents need world models 论文链接:https://arxiv.org/abs/2506.01622 香港中文大学博士 Richard C. Suwandi 撰写了一篇博客文章,详细解读了这篇开创性的论文及其对 AGI 未来的意义。 | AUTHORS | AFFILIATIONS | PUBLISHED | | --- | --- | --- | | Richard Cornelius Suwandi | The Chinese University of Hong Kong, Shenzhen | June 11, 2025 | 想象一下,如果我们能够构建一个像人类一样思考和计划的人工智能,未来会是什么样子。大语言模型(L ...
LeCun亲自官宣!Meta世界模型V-JEPA 2登场!仅用62小时机器人数据,就能实现零样本控制!
AI科技大本营· 2025-06-12 10:48
出品丨AI 科技大本营(ID:rgznai100) 让 AI 像人一样理解世界并与环境互动。 整理 | 梦依丹 Meta 重磅发布了 V-JEPA 2(Video Joint Embedding Predictive Architecture 2) 世界模型,并同时 发布了三个全新的基准测试,用于评估现有 模型通过视频对物理世界进行推理的能力。 这次,Meta 首席 AI 科学家 Yann LeCun 亲自出镜,并介绍了世界模型与其他模型的不同之处。 V-JEPA 2 是 一款基于视频训练的先进 AI 系统,旨在赋予机器更深层次的物理世界理解、预测及交互能力,向着构建更通用的AI智能体迈出关键一 步。 一经发布,便在 X 上引发了众多关注与讨论。 目前 V-JEPA 2 在 Hugging Face 物理推理能力排行榜上排行第一,已超过 GPT-4o。 | Model Name | IntPhys 2 (%) | MVPBench (%) | CausalVQA (%) | Model Type | Vision Backbone | LLM Backbone | Submission Date | | -- ...
杨立昆的“反ChatGPT”实验,能救Meta吗?
Di Yi Cai Jing· 2025-06-12 09:20
Meta选择双线并进,以应对AI大战。 当OpenAI和谷歌在生成式AI赛道狂奔时,Meta却因Llama 4的失利陷入被动,现在,这一巨头正准备用两套截然不同的方案破局。 4月,Llama 4发布后的种种失误表现将Meta推上了风口浪尖,同时被批评的还有Meta首席人工智能科学家杨立昆(Yann LeCun),作为曾经的图灵奖得主、 有着数千亿美元的资源,却坚决反对主流LLM路线,而目前Meta已经在海外AI大厂的竞争中落后了。 在这个时间点,杨立昆看起来需要用新的成果来证明自己。北京时间6 月 12 日,他亲自出镜介绍了Meta最新的人工智能模型 V-JEPA 2,这是一种不同于当 前主流Transformer架构的"世界模型",旨在帮助机器和其他AI助手理解和驾驭周围的世界。 但这条"非主流"路线真的能成功吗?看起来Meta CEO扎克伯格(Mark Zuckerberg)也不确定,就在这两日,他被曝亲自下场招人,组建新的AI团队,并高 薪挖来谷歌DeepMind的首席研究员,另一边投资千亿元押注初创公司Scale AI,邀请CEO加入新的AI团队。 面对当前AI战略的失利,扎克伯格显然选择了"不把鸡蛋 ...
Meta发布世界模型,被群嘲的开源旧王要反击了
Hu Xiu· 2025-06-12 08:29
本文来自微信公众号:APPSO (ID:appsolution),作者:appso,原文标题:《小扎砸 9 位数挖 AI 大神、杨立昆发布世界模型,被群嘲的开源旧王要反 击了》,题图来自:视觉中国 Llama 4的折戟沉沙没有让Meta知难而退,反而坚定了All In AI的决心。 最近,创始人扎克伯格亲自操刀组建"超级智能"团队,重金投资Scale AI、以及砸9位数挖角Google、OpenAI的顶级科学家,也因此抢占了这几天的国际 头版头条。 就在今天凌晨,Meta也开源了最新的重量级模型——V-JEPA 2。 不同于市面上的写作或聊天类AI,V-JEPA 2的目标是让AI能够看懂世界、具备物理推理能力,并在完全陌生的环境中自主完成一系列实际操作任务。比 如识别一个没见过的物体,走进厨房,准确地把它放到目标位置上,全程无需手把手训练。 图灵奖得主、Meta首席科学家Yann Lecun也亲自出镜,为V-JEPA 2背书,强调让机器理解物理规则的重要性,认为世界模型能够拥有像人类一样理解世界 的常识,不靠海量试错,也能在真实物理世界中行动自如。 0:00 / 2:42 V-JEPA 2:现实世界的操作系统 ...
LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代
量子位· 2025-06-12 08:17
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 物理学正在走向人工智能—— Meta开源发布 V-JEPA 2 世界模型:一个能像人类一样理解物理世界的AI模型。 图灵奖得主、Meta首席AI科学家 Yann LeCun 亲自出镜宣传,并称: 我们相信世界模型将为机器人技术带来一个新时代,使现实世界中的AI智能体能够在不需要大量机器人训练数据的情况下帮助完成家务 和体力任务。 那什么是世界模型呢? 简单说,就是能够对真实物理世界做出反应的AI模型。 它应该具备以下几种能力: V-JEPA 2 (Meta Video Joint Embedding Predictive Architecture 2 ) 是首个 基于视频训练 的世界模型 (视频是关于世界信息丰富且 易于获取的来源) 。 它提升了动作预测和物理世界建模能力,能够用于 在新环境中进行零样本规划 和 机器人控制 。 理解:世界模型应该能够理解世界的观察,包括识别视频中物体、动作和运动等事物。 预测:一个世界模型应该能够预测世界将如何演变,以及如果智能体采取行动,世界将如何变化。 规划:基于预测能力,世界模型应能用于规划实现给定目标的行动序列。 ...
LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代
量子位· 2025-06-12 08:16
Meta开源发布 V-JEPA 2 世界模型:一个能像人类一样理解物理世界的AI模型。 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 物理学正在走向人工智能—— 图灵奖得主、Meta首席AI科学家 Yann LeCun 亲自出镜宣传,并称: 我们相信世界模型将为机器人技术带来一个新时代,使现实世界中的AI智能体能够在不需要大量机器人训练数据的情况下帮助完成家务 和体力任务。 那什么是世界模型呢? 简单说,就是能够对真实物理世界做出反应的AI模型。 它应该具备以下几种能力: V-JEPA 2 (Meta Video Joint Embedding Predictive Architecture 2 ) 是首个 基于视频训练 的世界模型 (视频是关于世界信息丰富且 易于获取的来源) 。 它提升了动作预测和物理世界建模能力,能够用于 在新环境中进行零样本规划 和 机器人控制 。 理解:世界模型应该能够理解世界的观察,包括识别视频中物体、动作和运动等事物。 预测:一个世界模型应该能够预测世界将如何演变,以及如果智能体采取行动,世界将如何变化。 规划:基于预测能力,世界模型应能用于规划实现给定目标的行动序列。 ...
被“网暴”两个月后,Yann LeCun 携最新世界模型杀回!小扎千万美元激励抢人,Meta AI 内部权利之争开始
AI前线· 2025-06-12 06:07
整理 | 华卫 昨日,Meta 推出了其新的"世界模型"V-JEPA 2,旨在实现物理世界中顶尖的视觉理解与预测能力,以提升 AI 主体的物理推理 能力。对于构建能在物理世界中运作的 AI 智能体和实现高级机器智能(AMI)的工作而言,物理推理能力至关重要。 在一段发布的 V-JEPA 2 视频演示中,图灵奖获得者、Meta 首席 AI 科学家 Yann LeCun 将 V-JEPA 2 描述为"现实的抽象数字 孪生",使 AI 能够 "预测其行为的后果" 并 "规划行动方案以完成给定任务"。 "我们相信,世界模型将开启机器人技术的新纪元,使现实世界中的 AI 主体能够帮助完成家务和体力任务,而无需海量的机器 人训练数据。" 比英伟达的 Cosmos 模型快 30 倍, 现已开源 作为人类,我们具备预测物理世界如何因响应自身或他人行为而变化的能力。例如,你知道将网球抛向空中时,重力会将其拉 回地面;在陌生的拥挤区域行走时,你会朝着目的地移动,同时避免碰撞沿途的人群或障碍物;打曲棍球时,你会滑向冰球的 前进方向,而非它当前的位置。 实际上,人类是通过观察周围世界并构建内部模型来形成这种物理直觉,进而预测假设行为 ...
刚刚,LeCun亲自出镜,Meta推出新世界模型!
机器之心· 2025-06-12 00:53
机器之心报道 机器之心编辑部 最近,Meta 大动作不断。 前些天有外媒曝出马克・扎克伯格正在组建一个名为「超级智能团队」的专家团队,以实现通用人工智能。随后开出 9 位数的薪酬为该团队吸纳人才。 就在刚刚,Meta 又有新的动作,推出 基于视频训练的世界模型 V-JEPA 2(全称 Video Joint Embedding Predictive Architecture 2) 。其能够实现最先进的环境理 解与预测能力,并在新环境中完成零样本规划与机器人控制。 Meta 表示,他们在追求高级机器智能(AMI)的目标过程中,关键在于开发出能像人类一样认知世界、规划陌生任务执行方案,并高效适应不断变化环境的 AI 系 统。 这次,Meta 首席 AI 科学家 Yann LeCun 亲自出镜,介绍世界模型与其他 AI 模型的不同。 他说,世界模型是一种现实的抽象数字孪生,AI 可以参考它来理解世界并预测其行为的后果。与理解语言不同,世界模型使机器能够理解物理世界,并能够规划 行动路线以完成任务,而无需进行数百万次的试验,因为世界模型提供了对世界运行方式的基本理解。能够使用世界模型进行推理和规划的 AI 将产生广泛 ...