グーグルは、PDFファイルの音声概要を生成する新機能をグーグルドライブに導入したと発表しました。この新機能は、NotebookLMやGemini、検索機能に続くもので、会話形式やポッドキャスト形式でPDFの要約を提供するということです。
グーグルドライブのPDFビューアにおけるGeminiの拡張機能として、ウェブ上で新たに「音声概要」ボタンが上部バーに追加されました。このボタンを押すと、Geminiのサイドパネルが開き、生成には数分かかるとしています。
「再生」をタップすると音声を聞くことができ、グーグルはメール通知も送信する方針です。音声概要は2分から10分の長さで、自動的に新しい「音声概要」フォルダに保存されます。これにより、ユーザーはモバイルやデスクトップデバイスからアクセスでき、Geminiチャットと比べてより集中化された利用が可能になるということです。
この機能はNotebookLMの音声概要と同じ基盤技術を使用しており、業界レポートや契約書、会議の議事録などの長文テキストを瞬時に変換できるとしています。
現時点では、グーグルドライブのPDF用音声概要は英語のみ対応しています。これはグーグルドキュメントの「聞く」機能に加わる形となります。
この機能は、現在、以下のグーグルワークスペースのティアに展開中です。また、グーグルワンのAI ProおよびAI Ultraの加入者にも利用可能です。
