Workflow
Project Genie
icon
Search documents
劈柴哥和哈萨比斯亲自站台!谷歌世界模型Project Genie刷屏,幕后团队揭秘60秒不是极限,内存是巨大约束
AI前线· 2026-01-30 09:58
作者 | 高允毅 今天,谷歌正式发布重磅世界模型原型产品"Project Genie", 只需一句话或一张图,就能一键生成可玩、可交互的实时虚拟世界。 它的重磅程度,让谷 歌"掌舵人"劈柴哥和 Google DeepMind 创始人哈萨比斯亲自为它站台。 世界模型真的变天了! 在 Project Genie 生成的虚拟世界中,你可以用 WASD 键移动角色、旋转视角、跳跃,在生成世界自由探索。更重要的是,其生成画面的精细度、整体 完成度,已经明显超出以往研究型 Demo 的范畴,在观感上直逼成熟游戏产品。 过去几年,世界模型一直被认为是通往 AGI 的重要路径,但始终存在一个根本问题:它们更像会动的视频,而不是真正的环境。 具体来说,早期世界模型普遍存在几大短板: 而 Project Genie,第一次把这些问题同时拉到了可用水平。 Project Genie 是一个基于 Genie 3、Nano Banana Pro 和 Gemini 构建的原型 Web 应用,其中的核心是谷歌最新的世界模型 Genie 3。 与以往"先生成完整视频"的方式不同,Genie 3 采用 自回归生成机制 :它会根据世界描述和用户 ...
马斯克真没吹牛!世界模型 Genie 3 一键打造 GTA6 不是梦
Sou Hu Cai Jing· 2026-01-30 09:25
首先我们要搞清楚一个概念,Project Genie 生成的本质上是一个实时渲染的交互环境。它的技术底座由三部分组成:负责图像控制的 Nano Banana Pro、 负责理解语言指令的 Gemini 模型,以及负责物理反馈的 Genie 3。 简单来说,它的机制和人类做梦的原理很像。 我们在做梦时,大脑会构建一个包含视听触觉的虚拟世界。虽然梦里的逻辑有时会跳跃,但沉浸感很强。Genie 其实就是让计算机学会「做梦」,并且允 许用户进入这个梦境进行互动。 此外,与 ChatGPT 这类基于文本统计规律的模型不同,Genie 3 本质上是一个「物理世界模型」。它虽然没学过物理公式,但通过观看几百万次物体运动 的视频,自己「学会」了重力、惯性这些物理规则。 体验 Project Genie 的方式也非常简单。 Google AI 产品宣传委员 Josh Woodward 就演示了全过程:他先把自己的照片转换成复古游戏风格的角色,然后上传到 Genie,输入「沙漠场景」和角色 描述。 点击生成后,他就能以牛仔的身份在沙漠里自由探索了。 https://www.youtube.com/watch?v=Ow0W3WlJ ...
谷歌开放世界模型一夜刷屏,AI游戏门槛归零时刻来了?
机器之心· 2026-01-30 08:49
去年 8 月,谷歌预发布了通用世界模型 Genie 3 ,它能够生成多样化的交互式环境。在这一早期阶段,受邀测试者们已经创造出了令人印象深刻且极具吸引力的虚 拟世界与沉浸式体验,并挖掘出了全新的使用方式。 接下来的目标是构建一个专注于「沉浸式世界创建」的交互式原型,进一步扩大受众范围。 因此自即日起,谷歌面向 美国 18 岁及以上的 Google AI Ultra 用户 开放了 Project Genie 的访问权限。 Project Genie 的多样性玩法 世界模型能够模拟环境的动态变化,并预测环境的演变方式以及动作对环境的影响。 谷歌世界模型,再一次惊艳了所有人! 今天一早, 谷歌 DeepMind 开放了世界模型 Genie 3 的实验性研究原型「Project Genie」,允许用户创建、编辑并探索虚拟世界 。 在世界模型 Genie 3 之外,Project Genie 同样由图像生成与编辑模型 Nano Banana Pro 和语言模型 Gemini 提供技术支撑。 与静态 3D 快照中的可探索体验不同,谷歌通用世界模型 Genie 3 会在用户移动并与世界交互时,实时生成前方的路径。 它能够为 ...
世界模型竞赛提速:蚂蚁灵波首次开源世界模型 谷歌开放世界模型体验平台
Huan Qiu Wang Zi Xun· 2026-01-30 08:38
来源:环球网 【环球网科技报道 记者 李文瑶】近日,全球人工智能领域接连迎来重磅消息。1月27日至30日,蚂蚁集 团旗下灵波科技连续四天密集开源发布四大核心模型——空间感知模型LingBot-Depth、具身大模型 LingBot-VLA、世界模型LingBot-World、具身世界模型LingBot-VA,构建了一套完整的开源具身智能开 发套件。尤为引人注目的是,就在蚂蚁灵波宣布其世界模型开源的次日,全球科技巨头谷歌紧随其后, 宣布面向美国特定用户开放其世界模型项目Project Genie的体验平台。 这一前一后的动作,标志着长期以来由少数巨头把持的世界模型壁垒,首次被中国科技企业以开源方式 撕开关键缺口,世界模型竞赛正从封闭研发加速转向开放生态的协同演进。 对此,德国财经媒体AdHocNews评论称,蚂蚁集团发布了名为 LingBot-World 的高质量机器人 AI 模拟 环境。这家中国金融科技公司完善了一套完整的开源工具包,用于物理 AI 系统的开发。这也是在全球 机器人领域话语权争夺战中的一项战略性举措。 蚂蚁灵波"四连发",开源构建具身智能基座 自1月27日起,蚂蚁灵波开启了一场具身智能领域的模 ...