DeepMind科学家揭秘Genie 3:自回归架构如何让AI建构整个世界 | Jinqiu Select
Google DeepMind于2025年8月4日晚间发布了Genie 3,这是一个革命性的通用世界模型(world model),能够从文本提示或图像生成高度互动的3D环境,支持实时 交互和动态修改。 当一个虚拟世界不再被一行行代码"规定",而是从数据中自行"涌现"时,这意味着什么?它又将为AGI的探索带来怎样的质变? 本文整理并翻译了对谷歌DeepMind两位核心研究员 Shlomi Fuchter 和 Jack Parker Holder 的独家专访,深入探讨了其最新发布的生成式交互环境模型——Genie 3。 锦秋基金(公众号:锦秋集;ID:jqcapital)认为,这篇文章揭示了Genie 3模型背后的一手信息,也点明了DeepMind在AGI探索上的一条不同思路,因此我们做了 编译。 01 一项"改变范式"的突破性技术 谷歌DeepMind近期独家展示了一项被誉为"前所未见、最令人震撼"的AI技术,它有望开启下一个万亿美元的商业版图,并可能成为虚拟现实(VR)领域的"杀手 级"应用。这项技术的核心是一种全新的AI模型——"生成式交互环境"(Generative Interactive Enviro ...