OpenAIは、音声AIの開発に力を入れる方針を発表しました。これは、ChatGPTの音質向上だけでなく、音声を重視した個人デバイスの開発を進めるためです。同社は、過去2か月間で複数のエンジニアリング、製品、研究チームを統合し、音声モデルの全面的な見直しを行ってきたということです。この新しいデバイスは約1年後に発売される予定です。
この動きは、技術業界全体がスクリーンに依存しない未来を目指していることを反映しています。スマートスピーカーは既にアメリカの家庭の3分の1以上に普及しており、音声アシスタントが日常の一部となっています。Metaは、Ray-Banのスマートグラスに5つのマイクを搭載し、騒がしい場所でも会話を聞き取れる機能を導入しました。Googleは、検索結果を会話形式で要約する「オーディオオーバービュー」を実験的に導入し、TeslaはxAIのチャットボット「Grok」を車両に統合して、ナビゲーションから気候制御まで自然な対話で操作できる音声アシスタントを開発しています。
この分野に注力しているのは大手企業だけではありません。多様なスタートアップ企業も同様のビジョンを持ち、さまざまな成功を収めています。Humane AI Pinの開発者は、スクリーンレスのウェアラブルデバイスの開発に数億ドルを費やしましたが、これは警告の例となりました。また、Friend AIペンダントは、プライバシー問題や存在意義に関する懸念を引き起こしています。さらに、少なくとも2社、SandbarとPebbleの創設者エリック・ミジコフスキーが率いる会社は、2026年に発売予定のAIリングを開発中で、ユーザーが手に話しかけることができるようになります。
形状は異なりますが、音声が未来のインターフェースであるという考えは共通しています。家庭や車、さらには顔までもが操作の表面となる時代が到来しています。
OpenAIの新しい音声モデルは、2026年初頭に発表される予定で、より自然な音声を提供し、実際の会話のように中断を処理し、ユーザーが話している間にも応答できるということです。また、眼鏡やスクリーンレスのスマートスピーカーなど、ツールというよりも伴侶のように機能するデバイスのファミリーを構想しているとしています。
この動きは驚くべきことではありません。The Informationによれば、OpenAIが5月に65億ドル(約1兆円)で買収したio社を通じてハードウェア開発に参加した元Appleのデザイン責任者ジョニー・アイブ氏は、デバイス依存を減らすことを優先課題としており、音声重視のデザインを過去の消費者向けガジェットの「誤りを正す」機会と見ています。
