グーグルは、新しい画像生成モデル「Nano Banana Pro」を発表しました。このモデルは、最新の大規模言語モデル「Gemini 3」を基に開発され、画像の詳細度やテキストの正確さを向上させるとしています。
「Nano Banana Pro」は、前モデルである「Nano Banana」と比較して、より詳細な画像と正確なテキストを生成する能力を持ち、異なるスタイルやフォント、言語でのテキスト生成が可能です。また、ウェブ検索機能を備え、レシピの検索やフラッシュカードの生成ができるということです。
このモデルは、プロフェッショナルが画像をよりコントロールできるように設計されており、カメラアングルやシーンの照明、被写界深度、フォーカス、色調補正などを調整できるとしています。「Nano Banana」の解像度制限1024 x 1024ピクセルに対し、「Nano Banana Pro」では2Kや4K画像の生成が可能です。
しかし、「Nano Banana Pro」は、より高品質な画像を生成できる一方で、速度が遅く、コストも高いとされています。旧モデルでは1024px画像あたり0.039ドル(約6円)でしたが、新モデルでは1080pまたは2K画像あたり0.139ドル(約22円)、4K画像あたり0.24ドル(約37円)です。
新モデルは、高忠実度ショットを6つ使用したり、最大14個のオブジェクトを画像内でブレンドしたりすることができ、最大5人の一貫性と類似性を維持します。これらの機能を試せるデモアプリも公開されています。
「Nano Banana Pro」は、グーグルの既存のAIツールに順次展開されており、Geminiアプリではデフォルトで新モデルが使用されます。ただし、無料サブスクリプション層のユーザーは、限られた数の画像生成後、元の「Nano Banana」モデルに戻されるということです。
Google AI Plus、Pro、Ultraのサブスクライバーは、より高い生成制限を受けられますが、正確な限度は公開されていません。これらのサブスクライバーは、NotebookLM内でもモデルにアクセス可能です。
また、米国のAI ProおよびUltraサブスクライバー向けに、AIモードでの検索を通じてモデルが利用可能になり、Ultraサブスクライバーは動画ツール「Flow」でもモデルを利用できるようになっています。Workspaceの顧客は、Google SlidesやVidsでも利用可能です。
開発者は、Gemini API、Google AI Studio、および新しいIDE「Antigravity」を通じて「Nano Banana Pro」を利用できます。
さらに、グーグルは、AI生成画像の透かしと検出技術「SynthID」をGeminiアプリに組み込んでおり、ユーザーは画像をアップロードして、同社の画像モデルによって生成または修正されたかどうかを確認できます。
グーグルは、今後C2PAコンテンツクレデンシャル検出のサポートを含む方針です。
