グーグルは火曜日、AIベースのノートテイキングおよび研究アシスタントであるノートブックLMにビデオ概要機能を導入したと発表しました。この機能は、5月のグーグルI/Oで初めて紹介され、ユーザーが生のノート、PDF、画像などの複雑なマルチメディアを視覚的に理解しやすいプレゼンテーションに変換できるということです。
これまで、ノートブックLMは音声概要機能を通じてユーザーの理解を助けてきました。音声概要は、AI仮想ホストを使用して、ユーザーが共有した文書に基づいてポッドキャストを生成する機能です。これには、コースリーディングや法的文書が含まれます。
新しいビデオ概要機能により、ノートブックLMは視覚的なアプローチでさまざまなトピックやアイデアの理解を助ける方針です。グーグルによれば、ビデオ概要は音声概要の視覚的な代替として考えることができ、アップロードされた文書から画像、図、引用、数字を引き出して内容を説明します。この機能はデータの説明やプロセスのデモンストレーション、抽象的な概念の理解を容易にするのに適しているとしています。
ユーザーは音声概要と同様にビデオ概要をカスタマイズできます。焦点を当てるトピックを指定したり、学習目標を示したり、ターゲットオーディエンスを記述したりすることが可能です。
例えば、「このトピックについて何も知らないので、論文の図を理解する手助けをしてください」や、「Xについては既に専門家であり、私のチームはYに取り組んでいるので、Zに焦点を当ててください」といった質問ができます。
ビデオ概要は現在、英語で全ユーザーに提供されており、今後さらに多くの言語に対応する予定ですとしています。
また、グーグルはノートブックLMのスタジオパネルへのアップデートも発表しました。ユーザーは同じタイプのスタジオ出力を複数作成し、1つのノートブックに保存できるようになりました。さらに、スタジオパネルの上部には音声概要、ビデオ概要、マインドマップ、レポートをワンクリックで作成するための4つのタイルが表示されるようになりました。
加えて、ユーザーはスタジオパネル内でマルチタスクが可能となりました。例えば、音声概要を聞きながら同時にマインドマップを探索したり、スタディガイドを確認したりすることができます。