AIは「ポケモン赤」をクリアできるのか？　Claude 3.7 Sonnetが“ゲーム実況”、開発元がプレイ動画を配信中 – ITmedia AI＋

AIは「ポケモン赤」をクリアできるのか？　Claude 3.7 Sonnetが“ゲーム実況”、開発元がプレイ動画を配信中

米Anthropicは2月26日、同社の最新AIモデル「Claude 3.7 Sonnet」がゲーム「ポケットモンスター赤」（ポケモン赤）をプレイする様子を「Twitch」で配信中だ。同AIモデルの性能を示すためのプロジェクトとみられる。

Claude 3.7 Sonnetは、Anthropicが25日に発表したAIモデルで、大規模言語モデル（LLM）と、数学やコーディングなどのタスクを得意とする「推論モデル」を1つのモデルに統合している「ハイブリッド推論モデル」なのが特徴。推論モデルを活用した推論能力の向上などにより、コーディングのタスクでは、米OpenAIのAIモデル「o1」を大幅に超える性能を示したという。

またAnthropicはベンチマークの一環として、Claude 3.7 Sonnetにポケモン赤をプレイさせた。同AIモデルはポケモン赤をプレイするために開発されたわけではないため、ゲーム画面内で主人公を移動させるための機能などを搭載。継続的にポケモン赤をプレイできるようにして、Claude 3.7 Sonnetの性能を検証した。

今回の配信は、検証したClaude 3.7 Sonnetのポケモンのプレイ性能を示すための実演とみられる。

Claude’s extended thinking \ Anthropic
https://www.anthropic.com/research/visible-extended-thinking
ClaudePlaysPokemon | Twitch
https://www.twitch.tv/claudeplayspokemon