OpenAIは、ChatGPTの音声モデルを強化し、AIを活用した個人用デバイスの発売に備えていると発表しました。関係者によれば、このデバイスは主に音声を基盤としたものであるということです。
新しい音声モデルのアーキテクチャは、より自然で感情豊かな応答を生成し、より正確で詳細な回答を提供するということです。また、人間のユーザーと同時に話すことができるようになり、現在のモデルでは難しい中断への対応も向上するとしています。この新しい音声モデルは、2026年の第1四半期にリリースされる予定です。
報告によれば、OpenAIの新しいハードウェア製品は、約1年後の発売を予定しているということです。さらに、この製品は一連のデバイスの第一弾であり、すべてが音声に特化した製品群になる方針です。具体的には、ディスプレイのないスマートスピーカーやメガネ型デバイスなどが検討されていると伝えられています。
9to5Macは、ChatGPTとのやり取りがどれほど人間らしくなるかに注目しています。現在のところ、音声モードを使用することはほとんどありませんが、これは必ずしも現在の制限によるものではありません。むしろ、周囲に他の人がいる環境が多いため、テキストによるやり取りが適しているからです。
音声に完全に基づいたデバイスの構築はリスクがあるように思われますが、Jony Ive氏やSam Altman氏のチームが行っている作業には大きな関心を持っています。
