Googleは、8月にPixel 10の発表と共に予告していたジェミニライブのネイティブオーディオ出力が、AndroidとiOSで利用可能になったと発表しました。
ジェミニライブは「新しいモデルのアップデート」により、「人間のスピーチの主要な要素を理解し、使用する能力を劇的に向上させた」ということです。これにより、会話が「より適応的で表現力豊か」になるとしています。
ユーザーはジェミニライブに対して、応答の速度を速めたり遅くしたりするように指示できるようになりました。Googleは、ユーザーが「速くして」と言うことで、あるトピックについての「短期集中講座」を受けることができるとしています。これにより、ジェミニのスピーチをより快適で理解しやすい速度に調整することで、アクセシビリティが向上する方針です。
また、言語学習のカスタマイズも可能で、「韓国語で10の倍数をクイズ形式で出題させたり、スペイン語でのカジュアルな挨拶を練習する」ことができるとしています。
これらのカスタマイズは会話の間持続しますが、チャットの記録に戻りライブボタンをタップすることで再開可能です。新しい会話を始めるとすべてリセットされます。
これらのモデルアップデート、推定されるジェミニ2.5フラッシュライブAPIネイティブオーディオは、ここ数週間で展開されており、現在AndroidとiOSで利用可能です。
