Google’s Gemini panicked when playing Pokemon | TechCrunch

GoogleのAIモデル「Gemini 2.5 Pro」がポケモンゲームをプレイする際に「パニック」に陥る現象が報告されています。
この現象は、AIがポケモンの健康が危険な状態にあるときに発生し、その結果、AIの推論能力が著しく低下することが観察されています。
GoogleとAnthropicは、AIモデルの性能を比較するためにポケモンゲームを利用しており、AIのプレイスタイルを観察することでモデルの動作を理解する手助けとなっています。
Gemini 2.5 Proは、ポケモンが危機的な状況にあるときに「パニック」を模倣し、その結果、特定のツールを使用しなくなることがあります。この行動は、人間がストレス下で誤った判断をする様子に似ており、Twitchでのストリーミング中には視聴者がリアルタイムでAIのパニック状態を観察し、その行動に驚いています。
一方、AnthropicのAI「Claude」も独自の行動を示し、ゲームのルールを誤解して自らを「倒す」試みをするなど、興味深い結果を生んでいます。さらに、Gemini 2.5 Proは特定のパズルを解く能力において人間を上回ることがあり、ボルダーパズルに関する指示を与えることで、複雑なパズルを一発で解くことができるとされています。
このように、AIがポケモンゲームをプレイする過程での行動は、AIの限界や可能性を探る上で非常に興味深い事例となっており、今後の研究が期待されます。
Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, LongContext, and Next Generation Agentic Capabilities.(PDF)
https://storage.googleapis.com/deepmind-media/gemini/gemini_v2_5_report.pdf
Gemini Plays Pokemon
https://www.twitch.tv/gemini_plays_pokemon
Claude Plays Pokemon
https://www.twitch.tv/claudeplayspokemon

