DeepMindがAGI実現の鍵となる世界モデル「Genie 3」を公開 | TechCrunch

DeepMind reveals Genie 3, a world model that could be the key to reaching AGI | TechCrunch

DeepMind thinks its new Genie 3 world model presents a stepping stone toward AGI | TechCrunch
Google DeepMind has revealed Genie 3, its latest foundation world model that the AI lab says presents a crucial stepping...続きを読む

DeepMindは、人工一般知能(AGI)への重要なステップとなる新しい基盤モデル「Genie 3」を発表しました。

このモデルは、従来の狭い世界モデルを超え、特定の環境に依存せず、リアルタイムでインタラクティブな3D環境を生成することができます。

Genie 3 はまだ研究プレビューの段階で一般公開されていませんが、DeepMindの研究ディレクターであるShlomi Fruchter氏は、「Genie 3は、写真のようにリアルな世界と想像上の世界の両方を生成できる初の一般目的の世界モデルです」と述べています。

Genie 3は、前のバージョンであるGenie 2や、物理学の深い理解を示す最新のビデオ生成モデル「Veo 3」を基にしています。

テキストプロンプトを使用することで、Genie 3は最大数分間の多様なインタラクティブな3D環境を生成でき、フレームレートは24fps、解像度は720pです。

また、「プロンプト可能な世界イベント」つまりプロンプトを使って生成された世界を変化させる機能も搭載されています。

特に注目すべきは、Genie 3が生成したシミュレーションが時間の経過とともに物理的に一貫性を保つことができる点です。

これは、DeepMindの研究者が明示的にプログラムしなかった能力であり、モデルが以前に生成した内容を記憶することで実現しています。

この記憶能力により、物理的に妥当な環境をシミュレートすることが可能になり、エージェントの訓練に理想的な場を提供します。

DeepMindの研究科学者であるJack Parker-Holder氏は、「世界モデルはAGIへの道の鍵であり、特に具現化されたエージェントにとって、現実世界のシナリオをシミュレートすることが特に難しい」と述べています。

Genie 3は、エージェントが入力に反応するだけでなく、計画を立て、探求し、不確実性を求め、試行錯誤を通じて改善する能力を育むことが期待されています。

現在、エージェントが取れる行動の範囲はまだ限られていますが、Genie 3はエージェントが自らの経験から学ぶ能力を高めるための重要な進展を示しています。

Parker-Holder氏は、「具現化されたエージェントが現実世界で実際に斬新な行動をとることができる37手目の瞬間はまだ来ていない、しかし今、私たちは新たな時代を導く可能性がある」と語っています。

このように、Genie 3はAGIへの道を切り開くための重要な技術的進歩を示しており、教育や新しいメディア、ゲーム開発など多くの分野において革新をもたらす可能性があります。

Genie 3: A new frontier for world models – Google DeepMind
https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/

Translate »
タイトルとURLをコピーしました