グーグルは、新しい技術「Project Genie」を発表し、AIを活用してプレイ可能な世界を生成できると発表しました。この技術は、米国のAI Ultraサブスクライバーに提供され、今後、他の地域にも拡大する方針です。
「Genie 3」は、多様でインタラクティブな環境を生成する汎用的な世界モデルであるということです。世界モデルは環境の動態をシミュレーションし、どのように進化し、行動がどのように影響を与えるかを予測します。グーグルのDeepMindは、これまでもチェスや囲碁のような特定の環境のエージェントを開発してきましたが、AGI(人工汎用知能)の構築には、現実世界の多様性をナビゲートするシステムが必要であるとしています。
この実験的な研究プロトタイプでは、ユーザーが自分の環境を説明し、どのように探索したいかを指定します。キャラクターの種類を選択すると、「Nano Banana Pro」を使用してプレビュー画像が生成されます。これにより、ユーザーは世界に入る前にイメージを微調整することができます。
ユーザーは「世界を作成」し、60秒間のセッションに制限されます。フォトリアリスティックな世界は720pの解像度で、インタラクションは20〜24フレーム毎秒で行われます。動くと、Genie 3がリアルタイムで進行方向を生成し、物理的な相互作用を高い一貫性でシミュレートします。ユーザーはカメラを調整し、ウォークスルーのビデオをダウンロードすることもできます。
また、「Remix Worlds」機能を使って、既存の世界を新しい解釈にリミックスすることができ、ギャラリーやランダマイザーアイコンでキュレーションされた世界を探索することも可能です。
60秒の制限に加え、グーグルは「探索中に世界が変化するプロンプト可能なイベント」の改善に取り組んでいるということです。このデモは、AI研究や生成メディアの多くの分野での世界モデルの利用方法を理解するためのものです。
グーグルは、これらの体験と技術をより多くのユーザーに提供することを目指しているとしています。世界モデルは、ロボティクスやアニメーションのモデリング、フィクションのほか、場所や歴史的な設定の探索など、実用的な応用が期待されています。
