グーグルは、AIモードを更新し、検索時により視覚的な体験を提供することを発表しました。これにより、インスピレーションを得る際やショッピングの際に、テキストとともに画像が表示されるようになります。主な利用例として、「ベッドルームのマキシマリストなインスピレーションを見せて」といったリクエストに対し、求める雰囲気に合った豊かなビジュアルが返されるということです。
この体験の重要な部分は、結果を会話形式で絞り込む能力です。たとえば「もっと暗いトーンと大胆な柄で」とリクエストすることができます。チャットのコンテキストが保持されるため、具体的な指示を追加する必要はありません。各画像結果はリンクとなっており、拡大表示や「AI会話に追加」することが可能です。また、画像をアップロードしてプロンプトを開始することもできます。
ショッピングにおいては、グーグルはこの新しい機能を「友人に話しかけるように、フィルターを通さずに探しているものを説明できる」と説明しています。例えば「あまりゆったりしすぎないバレルジーンズ」を探している場合、「もっと足首丈のものが欲しい」と言って絞り込むことができます。これはグーグルのショッピンググラフに登録された50億以上の商品リストを活用したものです。
グーグルは「ビジュアルサーチファンアウト」と呼ばれる技術を活用しています。AIモードが画像の包括的な分析を行い、主な対象物に加えて微細なディテールや副次的なオブジェクトを認識します。その後、複数のクエリをバックグラウンドで実行し、自然言語の質問の視覚的コンテキストとニュアンスを理解して、非常に関連性の高い視覚的な結果を提供します。最終的には画像のグリッドが表示されます。
この画期的な視覚検索体験は、グーグル検索のレンズや画像検索の世界クラスの視覚理解と、ジェミニ2.5の高度なマルチモーダルおよび言語能力を組み合わせたものです。
グーグルによると、この視覚AIモードは今週から米国の英語ユーザーに提供開始されるということです。
