グーグルは本日、ジェミニ2.5フラッシュネイティブオーディオの最新バージョンを発表しました。このアップデートにより、AIモードのサーチライブが恩恵を受けることになります。
先月のジェミニライブと同様に、サーチライブの応答はこれまで以上に「流暢で表現力豊か」になるということです。これには、より自然な音声や、応答を遅くする機能が含まれているとしています。
ジェミニ2.5フラッシュネイティブオーディオは、今週中に米国のすべてのサーチライブ(AndroidおよびiOS)ユーザーに提供される予定です。
また、今日のアップデートはライブ音声エージェントを構築するサードパーティの開発者にも利用可能です。前のバージョンと比較して、3つの改善点があります。
もう一つのアップグレードは、ライブ音声翻訳のサポートです。今日のグーグル翻訳のアップデートと同様に、ジェミニは「誰が話しているかに基づいて出力言語を自動的に切り替え、リアルタイムで2つの言語間を翻訳する」ことができるとしています。
例えば、英語を話す人がヒンディー語の話者と会話したい場合、ヘッドフォンで英語の翻訳をリアルタイムで聞くことができ、話し終わると携帯電話がヒンディー語を放送するということです。
特に、翻訳結果は話者のイントネーション、ペース、ピッチを保持しながら、周囲のノイズを除去することができるとしています。自動言語検出と多言語入力をサポートしており、「ジェミニモデルの世界知識と多言語能力をネイティブオーディオ機能と組み合わせる」ことで、70以上の言語と2,000の言語ペアをサポートする方針です。
