别盯着GPT-5了!Google这款Genie 3世界模型,才是未来的AI核心战场
前言 过去几天,AI圈的头条几乎被GPT-5刷屏了。大家都在谈它的新功能、新突破。 (这个新页面真的是 五彩斑斓 在我看来,这个Genie 3比GPT-5更值得关注。 为什么?因为世界模型现在正处在一个"人无我有"的阶段:会做世界模型的公司少之又少,而且一旦突破,就可能重塑整个AI版图。 (还不知道 所有行业的生命周期,16字箴言的,可以去上一条公众号补课 为什么说GPT-5的潜力有限? 我 之前分析过,大语言模型(LLM)基于Transformer架构的发展,已经逼近"天花板"。它的升级幅度在变小,而且它生成的依然是语言描述, 不是可以进入、探索、互动的环境。 (想了解 大语言模型LLM前世今生的可以去这条公众号补课 世界模型到底是什么? 世界模型不是生成视频,而是生成一个可以探索、可以互动、而且逻辑一致的世界。跟视频的区别很大。 视频:你只能被动看,播放内容是固定的。世界:你能自由探索,走到哪、看到哪,都会动态生成相应的画面和细节,而且一切都符合物理常识。 举个例子:在Genie 3里,你可以生成一个树林的世界,然后走到树林里看树叶上的水珠,光影会随角度变化;你可以离开很久,再回来,环境依旧保持 之前的样 ...