アメリカのIT大手、グーグルは、自社の生成AI「ジェミニ(Gemini)」のパーソナル・インテリジェンス機能に、「ナノ・バナナ」と呼ばれる技術を活用した画像生成機能を追加したと発表しました。これにより、利用者の個別の背景や好みを反映した画像が作成できるようになるということです。
この新機能では、利用者がプロンプト(指示文)で詳細な条件を指定しなくても、ジェミニが利用者の好みや関心を自動的に読み取り、画像を生成します。これは、Gメールやグーグルフォトなど、グーグルのアカウントにひも付いたデータから背景情報を取得することで実現しているということです。
例えば、「テニスと音楽が好きな私の理想の家を生成して」と入力する代わりに、単に「私の理想の家をデザインして」と指示するだけで、利用者の趣味を反映した画像が作成されるとしています。
さらに、この「ナノ・バナナ」を活用した連携機能は、グーグルフォトのラベル機能も利用します。これにより、「家族」のようなグループを指す言葉や名前をAIが理解できるようになります。具体的には、「私と家族が一番好きな活動をしている画像を生成して」といった指示で画像を作成できるということです。
グーグルによりますと、画像生成の際にAIがどのような背景情報を参照したかについては、「ソース」ボタンから確認できるとしています。
一方で、他の連携機能と同様に、ジェミニが背景情報を誤って認識する可能性もあるため、利用者からフィードバックを送信できる仕組みを設けています。また、「+」アイコンをクリックすることで、画像生成の参考となる写真を利用者自身が追加することもできるということです。
この画像生成機能は、アメリカ国内の「Plus」「Pro」「Ultra」のプラン契約者を対象に、数日以内に提供が開始される予定です。グーグルは今後、デスクトップ版のブラウザーや他の利用者にも順次、機能を提供する方針です。
グーグルは今年に入ってパーソナル・インテリジェンス機能の提供を開始し、3月にはアメリカの全利用者に拡大しました。今週には、日本やインドなどの国々でも同機能の提供を始めており、個人のデータに基づいたAIサービスの展開をさらに強化していく狙いがあるとみられます。
