ジェミニアプリは、Google DeepMindの最新技術であるLyria 3を用いた音楽生成機能を全ユーザーに提供開始したと発表しました。Lyria 3は、これまでのバージョンと比較して、歌詞を自動生成する機能が追加されており、スタイル、ボーカル、テンポなどの要素を制御して、より現実的で音楽的に複雑なトラックを作成できるということです。
このモデルと機能は、既存のアーティストを模倣するのではなく、オリジナルの表現を目的として設計されているとしています。Googleは、著作権およびパートナー契約に非常に注意を払ってトレーニングを行っており、プロンプトに特定のアーティストを指定した場合、ジェミニはそのスタイルやムードを参考にしたトラックを生成する方針です。また、既存のコンテンツと出力を照合するフィルターも設けられています。
ジェミニアプリ内の「ツール」メニューには「音楽」が追加されており、特定のジャンルやムード、インサイドジョーク、思い出を記述して、歌詞付きまたはインストゥルメンタルの独自のトラックを作成することが可能です。写真やビデオクリップをアップロードすることで、そのムードに合った歌詞を持つトラックを作曲することもできます。
最終的に生成されるのは30秒のトラックで、Nano Bananaを活用してカスタムカバーアートを作成します。ファイルをダウンロードしたりリンクを取得したりして共有することができます。
安全性の面では、すべてのトラックにSynthIDウォーターマークが埋め込まれており、Google AIを使用して生成されたかどうかを確認することができます。ジェミニアプリは、現在、英語、ドイツ語、スペイン語、フランス語、ヒンディー語、日本語、韓国語、ポルトガル語で18歳以上のすべてのユーザーが利用可能です。Google AI Plus、Pro、Ultraの加入者にはより高い制限が適用されます。
将来的には、Googleはより多くの言語に拡大し、品質を向上させる方針です。
