谷歌Gemini 2.5 Pro通关《精灵宝可梦》,AI玩游戏时代来了?

谷歌Gemini 2.5 Pro通关《精灵宝可梦》,AI玩游戏时代来了?AI快讯主机格调

“Gemini 2.5 Pro 刚刚完成 Pokémon Blue 通关!”——谷歌CEO Sundar Pichai近日在X平台上的这句庆祝,让一个由软件工程师Joel Z独立开发的实验项目“Gemini Plays Pokémon”迅速走红。这标志着继Anthropic的Claude挑战《精灵宝可梦 Red》之后,又一个顶级AI模型在复杂游戏任务中取得了里程碑式的进展。

技术揭秘:AI是如何“玩”游戏的?

该项目并非简单的脚本操作。Gemini通过一个复杂的“agent harness”(智能体挽具)机制来玩游戏,其工作流程大致如下:

  1. 视觉分析: AI通过分析游戏截图来“看到”当前的游戏画面。
  2. 决策推理: 结合增强信息(如游戏地图、攻略数据),AI自主决定下一步的行动指令。
  3. 指令执行: 系统将AI的决策(如“向左走”、“使用技能A”)转换成真实的按键操作。

公平性讨论:这算“作弊”吗?

项目开发者Joel Z坦言,在开发过程中,他确实对AI的推理过程进行了一些“辅助干预”以优化其表现,但这并非直接替AI做决策的“作弊”。

行业视角:AI玩游戏的意义

虽然这只是一个个人实验项目,但它得到了谷歌高管的全程关注与支持,这背后反映出一个更深层次的趋势。让AI玩像《精灵宝可梦》这样需要长期规划、策略决策和目标导向的复杂游戏,是测试和展示**AI智能体(AI Agent)**能力的绝佳场景。

一个能成功通关游戏的AI,意味着它具备了执行长序列、多步骤复杂任务的潜力,这项能力未来可以被广泛应用于科学研究、商业分析乃至现实世界的自动化任务中。

未经允许不得转载:主机格调 » 谷歌Gemini 2.5 Pro通关《精灵宝可梦》,AI玩游戏时代来了?