OpenAIは10月3日、新しい音声・映像生成モデル「Sora 2」と、TikTokに似たアルゴリズムフィードを持つソーシャルアプリ「Sora」を発表しました。Sora 2は、昨年のモデル「Sora」の後継として、物理法則により忠実に従うことで、より現実的な映像を生成できるということです。
OpenAIは、Sora 2を使用した映像の例として、ビーチバレーボール、スケートボードの技、体操のルーチン、飛び込み台からのジャンプなどを公開しました。これらの映像は、以前のモデルで見られた物体の変形や現実の歪みを改善したとしています。
また、Soraアプリには「cameos」と呼ばれる「自分をアップロード」機能があり、ユーザーは自身の映像を生成されたシーンに挿入することができます。この機能を利用するには、ユーザーが一度だけ自身のビデオと音声をアップロードし、身元を確認する必要があるということです。
このアプリは現在、米国とカナダでダウンロード可能で、OpenAIは他の国への迅速な展開を目指しているとしています。Soraのソーシャルプラットフォームは現在招待制ですが、ChatGPT Proユーザーは招待なしでSora 2 Proモデルを試すことができる方針です。
生成された映像は、Soraアプリ内のフィードで共有でき、TikTokやInstagram Reelsに似た短編動画フィードのように見えるということです。OpenAIは、ユーザーのSoraでの活動、IPアドレスから取得した位置情報、過去の投稿のエンゲージメント、ChatGPTの会話履歴を考慮してアルゴリズムの推奨を行うとしています。
Soraアプリは、初期段階では無料で提供され、「その機能を自由に探求できるようにする」ことを目的としているとしています。収益化の計画としては、高需要時に追加の映像生成に料金を課すことを考えているということです。
OpenAIは、ソーシャルプラットフォームの立ち上げにあたり、ユーザーの安全対策を強化する方針です。AI生成映像における非同意の映像は依然として問題であり、プラットフォームの責任を明確にする法律が少ない中で、ユーザーの安全を確保する必要があるとしています。