グーグルは、最新のAIと機械学習の進展を活用し、グーグル翻訳に新たなライブ翻訳モードと言語練習ツールを追加したと発表しました。
グーグルは、翻訳の質やマルチモーダル翻訳、音声合成(TTS)の向上において、Gemini AIモデルが貢献しているとしています。
新しい「ライブ翻訳」機能では、リアルタイムで音声と画面上の翻訳を使って「双方向の会話」が可能です。新しいインターフェースを開始した後、アラビア語、フランス語、ヒンディー語、韓国語、スペイン語、タミル語など70の言語から選択できます。
スレッドベースのインターフェースにより、会話の間の「賢明な識別」によってスムーズに言語の切り替えが行われます。さらに、アクセントやイントネーションも考慮されます。高度な音声認識モデルは、騒音のある現実世界の環境でも音を識別できるように訓練されています。
この機能は、現在、米国、メキシコ、インドのユーザー向けにAndroidとiOSのグーグル翻訳アプリで提供が開始されています。
一方、グーグル翻訳には言語学習機能も追加されます。具体的には、会話の練習を支援することに焦点を当てています。スキルレベルや目標を指定するか、「日常のやり取り」や「旅行と交通」などのプリセットから選択します。
翻訳アプリは、シナリオに基づいて「あなた専用のリスニングとスピーキング練習セッション」を作成します。例えば、「食事の時間を尋ねる」などのシナリオを選択し、どのように練習したいかを決めます。
グーグルは、「日々の進捗を追跡し、他の言語で自信を持ってコミュニケーションを取るために必要なスキルを構築する手助けをする」としています。
この機能は、英語を練習するスペイン語、フランス語、ポルトガル語の話者、およびスペイン語とフランス語を練習する英語話者向けに、AndroidとiOSのグーグル翻訳アプリでベータ版として提供が開始されており、無料で利用できます。