Genie 2

Search documents
谷歌深夜放出「创世引擎」Genie 3,一句话秒生宇宙,终极模拟器觉醒
3 6 Ke· 2025-08-06 07:32
全球最强「世界AI模拟器」今夜诞生! 刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。 总有一天,UE5所有复杂功能,都能被一个数据驱动的「注意力权重」吸纳。 未来,只需要将手柄指令作为输入,即可渲染一段时空中的像素画面。 一句话,Genie 3即可生成一个动态世界。 令人惊艳的是,它能以每秒20-24帧速度,实时生成720p画面,还能持续数分钟一致性。 相比于前代,Genie 3在生成时长方面也得到了史诗级的加强——一口气能搞定长达数分钟,且内容连贯的可交互世界。 英伟达Jim Fan高度评价,「这就是游戏引擎2.0时代」! 如今,Genie 3的问世,标志着世界模拟AI迈向了全新高度,加速了人类通向AGI/ASI的终极目标。 AI实时交互模拟,真·矩阵世界 一直以来,「世界模型」被业界看作是通往AGI道路上的关键基石。 因为,它能让AI智能体在无限丰富的模拟环境中接受训练。 十多年来,谷歌DeepMind一直在模拟环境领域引领前沿研究,从训练AI智能体玩转即时战略游戏,到为开放式学习和机器人技术开发模拟环境。 正是在这些研究的推动下,他们开发出了「世界模 ...
DeepMind独家访谈实录,解密Genie 3世界模型,将颠覆游戏与机器人行业未来
3 6 Ke· 2025-08-06 06:14
当地时间8月5日,谷歌DeepMind最新研发的AI技术"Genie 3"被誉为一项革命性的突破,有望彻底改变 虚拟世界生成、机器人训练以及娱乐产业的未来。这项技术能够通过简单的文本提示,在约3秒内生成 一个可交互的、逼真的3D虚拟世界,达到720p分辨率,且具备实时交互和环境一致性等特性。Genie 3 不仅适用于游戏和虚拟现实(VR)领域,还为机器人和自动驾驶汽车的训练提供了无限可能的模拟环 境。 Youtube人气大V蒂姆·斯卡夫(Tim Scarfe)通过对DeepMind研究团队的独家采访,详细介绍了Genie 3 的创新功能、潜在应用以及未来前景。以下是采访全文内容摘要: 主持人:大家好,今天我们带来一项全球独家报道,我认为这是我见过的最令人震撼的技术,简直让人 兴奋不已!上周,我在伦敦谷歌DeepMind的办公室亲眼见证了这项技术的演示。这项技术可能成为下 一个价值万亿美元的产业,也可能是虚拟现实的杀手级应用。谷歌DeepMind近期表现极为出色,甚至 连Gemini Deepthink都无法统计其成功次数。 今天,我们将讨论一类全新的AI模型——生成式交互环境。它们不同于传统游戏引擎、模拟器或 ...
AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need
机器之心· 2025-06-13 02:32
机器之心报道 编辑:泽南、Panda 越通用,就越World Models。 我们知道,大模型技术爆发的原点可能在谷歌一篇名为《Attention is All You Need》的论文上。 如今,在通用人工智能(AGI)初现曙光,Scaling Laws 却疑似接近极限的当口,又是谷歌对未来方向进行了一番思考,想来想去还是只有五个词: 论文标题:General agents need world models 论文链接:https://arxiv.org/abs/2506.01622 香港中文大学博士 Richard C. Suwandi 撰写了一篇博客文章,详细解读了这篇开创性的论文及其对 AGI 未来的意义。 | AUTHORS | AFFILIATIONS | PUBLISHED | | --- | --- | --- | | Richard Cornelius Suwandi | The Chinese University of Hong Kong, Shenzhen | June 11, 2025 | 想象一下,如果我们能够构建一个像人类一样思考和计划的人工智能,未来会是什么样子。大语言模型(L ...
转身世界就变样?WorldMem用记忆让AI生成的世界拥有了一致性
机器之心· 2025-05-11 03:20
本文一作为肖泽琪, 本科毕业于浙江大学,现为南洋理工大学博士生, 研究方向是基于视频生成模型的世界生成和模拟,导师为潘新钢。个人主页: https://xizaoqu.github.io 近年来,基于视频生成模型的可交互世界生成引发了广泛关注。尽管现有方法在生成质量和交互能力上取得了显著进展,但由于上下文时间窗口受限,生成的世 界在长时序下严重缺乏一致性。 针对这一问题,南洋理工大学 S-Lab、北京大学与上海 AI Lab 的研究者提出了创新性的世界生成模型—— W orldM em ,通过引入记忆机制,实现了长时序一致 的世界生成。 WorldMem 在 Minecraft 数据集上进行了大规模训练,支持在多样化场景中自由探索和动态变化,并在真实数据集上验证了方法的可行性。 研究背景 世界生成模型在近期受到了广泛关注,如谷歌的 Genie 2 [1]、阿里的 The Matrix [2]、Meta 的 Navigation World Models [4] 等。这些方法在生成质量与交互性方面取 得了显著进展,但长时一致性问题仍未得到有效解决。 举例:当我们控制视角先向右转,再向左转。 在传统方法中,回看时 ...
谷歌DeepMind CEO展示Genie 2:机器人训练新时代
Sou Hu Cai Jing· 2025-04-22 02:24
机器人前瞻(公众号:robot_pro) 编译 | 江宇 Vertime ▲实机演示:Genie 2将加州瀑布顶部的照片转化为类似视频游戏场景 Hassabis表示,Genie 2的"世界模型"能够动态生成环境,模拟现实世界的物理特性。这种能力使其不仅适用于娱乐领域(如生成游戏和视频),更重要的是 为AI和机器人提供高效的训练平台。 Hassabis强调,Genie 2的核心目标是构建理解现实世界的模型,为机器人训练提供低成本、高效率的解决方案。传统的机器人数据采集受限于现实世界的复 杂性和高成本,数据量有限且收集速度慢。 而Genie 2的模拟环境可以生成近乎无限的数据量,允许机器人在虚拟世界中进行初步学习,随后通过少量现实世界数据进行微调。 编辑 | 漠影 机器人前瞻4月21日消息,谷歌DeepMind迎来突破性进展,其世界构建AI模型Genie 2展现了在机器人训练领域的巨大潜力。 DeepMind CEO兼联合创始人Demis Hassabis向《60分钟》节目展示了这一创新技术,强调其在创建可交互3D环境及加速机器人学习方面的应用前景。 Genie 2能够从单一静态图像生成可探索的3D虚拟世界,为A ...
喝点VC | 顶级风投Lightspeed发布生成式游戏报告:世界模型将是AI的下一个主要形式
Z Potentials· 2025-03-22 03:59
Core Insights - The article emphasizes that artificial intelligence (AI) is a transformative force in the gaming and interactive media industries, reshaping them faster than previous technological revolutions like the internet and mobile computing [3][4] - Lightspeed has invested approximately $2.5 billion in over 100 AI-related companies, indicating a strong belief in AI as a source of unprecedented value creation [2][4] Investment Landscape - Lightspeed's investment strategy focuses on companies that are core to AI, including those involved in machine learning, automation, and data analytics [4] - The firm supports category-defining companies in AI-driven fields such as character development, video generation, and music creation [5][6] AI's Impact on Gaming - AI is expected to significantly influence the gaming industry, with world models emerging as a key technology that can simulate virtual environments and enhance interactive experiences [3][9] - The development of world models has seen rapid advancements since 2018, with notable applications in gaming from companies like DeepMind and Tencent [3][11] World Models Development Timeline - The evolution of world models from 2018 to 2023 showcases significant breakthroughs, including the introduction of frameworks that allow AI to learn and navigate virtual worlds [13][20] - Key milestones include the introduction of PlaNet for detailed planning, Dreamer for simulating future scenarios, and DeepMind's Genie for generating interactive environments [19][20][21] Future Predictions - The article predicts that world models will not replace traditional AAA games in the short term but will create novel experiences that were previously impossible [44] - Challenges such as state management, memory limitations, and legal considerations will need to be addressed for world models to achieve their full potential [45][46][49] Emerging Applications - World models are expected to find valuable applications beyond gaming, particularly in robotics, where they can enable real-time understanding and interaction with complex environments [51][52] - The potential for multiplayer world models is acknowledged, though significant technical challenges remain [48]
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 14:59
2024 年 12 月的全球 AI 大事记。 文丨贺乾明 编辑丨程曼祺 2024 年 12 月的 AI 月报,你会看到: OpenAI、Google 发布新模型,中国的 DeepSeek 也抢到了风头 GPT-5 训练遇阻的更多细节 强化学习的重要性持续提升 至少有三个团队推出了世界模型 Google 霸占大模型竞技场前三 中国公司在开源社区存在感大涨 博通帮大公司自研 AI 芯片,市值破万亿美元 OpenAI 正式启动转型营利公司 20+ AI 公司获 5000 万美元以上投资,有 2 家中国公司 大模型的幻觉并不是一无是处 以下是我们第 2 期 AI 月报,欢迎大家在留言区补充我们没有提到的重要进展。 技术|10 亿美元没训出 GPT-5,新版 Scaling Laws 初步证明可行,多款世界模型亮相 GPT-5 训练遇阻的更多细节 OpenAI 训练 GPT-5(代号 Orion)遇阻,是大模型能力提升放缓的重要证据。12 月,多家媒体提供了更多的细 节: 2023 年 4 月推出 GPT-4 后,OpenAI 一直在开发 GPT-5,已经持续 20 个月。OpenAI 看到过乐观信号:24 年 4 月 ...