Workflow
AI玩宝可梦找出30年前代码Bug!谷歌论文介绍AI通关全过程,复杂任务都能解
量子位·2025-06-18 04:58

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌Gemini 2.5系列大模型技术报告发布,一大重点居然是AI玩《宝可梦》? 没错,就是那个童年回忆里的游戏,谷歌花超长篇幅介绍了Gemini 2.5 Pro玩《宝可梦蓝》时的具体行为,70页的论文,Pokemon关键词出 现59次。 其中特别报告了当AI控制的游戏角色濒临死亡时,Gemini 2.5 Pro会陷入"恐慌"状态,导致模型推理能力显著下降,甚至会忘记使用一些基本 功能,比如寻路工具。 这种恐慌行为出现过很多次,甚至观看直播的观众都已经能通过AI的行为模式,准确判断它什么时候在"恐慌"了。 事情开始于3月底,一位独立开发者Joel Zhang在Twitch上搭建了一个"Gemini玩宝可梦"的直播间,最初的目标只是直播播展示能玩完整游戏 的智能体工具的开发过程。 结果Gemini 2.5 Pro超出预期,测试期间直接把游戏打通关了,成为宝可梦联盟冠军,进入名人堂,走上AI生巅峰。 虽然整个过程用了831个小时,相比人类玩家平均只需要几十个小时差得很远。但在正式使用固定的智能体工具打第二次时,通关时间只用了 一半。 AI展现惊人游戏水平,复杂 ...