音声AI企業のElevenLabsは、iOSとAndroidユーザー向けにテキストから音声クリップを生成するための独立型モバイルアプリを発表しました。これまで、ElevenLabsのAI音声ライブラリを使用したサンプル生成はウェブアプリに依存していましたが、今回の発表により、モバイルアプリを利用して外出先でもクリップを生成できるようになるということです。
アプリの使用方法は、テキストを入力または貼り付け、適切な声を選択して音声クリップを生成するというものです。無料プランでは約10分間の音声生成が可能です。異なるモデルを選択してコストと品質のバランスを取ることができ、ウェブアプリとモバイルアプリの間で共有クレジット制限があるとしています。
さらに、アプリは最新のテキスト読み上げモデル「v3アルファ」にアクセスでき、タグを使って表現をコントロールすることが可能だということです。
ElevenLabsのモバイル成長責任者のジャック・マクダーモット氏は、TechCrunchに対し、多くのクリエイターがすでにモバイルのウェブブラウザを使って音声サンプルを作成し、CapCutやInstagram、InShotなどのアプリと共に使用していると述べました。この需要を受けて、同社はネイティブ体験を構築したいと考えたとしています。
「過去1年間で、ElevenLabsのコミュニティからのクリエイティビティが爆発的に増加しました。コンテンツクリエイター、マーケター、教育者、声優、そしてプロフェッショナルがプロジェクトを実現するためにElevenLabsを使用しています。多くの人がモバイルウェブブラウザからElevenLabsにアクセスし、より迅速で直感的、かつ強力なモバイルネイティブ体験を求めています」と同氏はメールで述べました。
同社はまた、SpeechifyやCaptionsなどの他の音声クローンおよび生成ツールとも競争する方針です。
これは、昨年発表された「Reader」アプリに続くElevenLabsの2つ目の消費者向けアプリです。Readerアプリは、記事、ブログ、PDF、電子書籍を外出先で聴くことができるもので、今年初めには出版社がオーディオブックを配信できるようにもなりました。
今後、同社は音声認識や会話型AIエージェントツールなどの新機能をリリースし、MCP技術を活用した「11.ai」などの体験をアプリに追加する計画です。