OpenAIは、ChatGPTに新たな汎用AIエージェントを導入したと発表しました。このエージェントは、ユーザーの代わりに様々なコンピュータベースのタスクを完了することができるとしています。たとえば、カレンダーの自動操作、編集可能なプレゼンテーションやスライドショーの生成、コードの実行が可能だということです。
このツールは「ChatGPTエージェント」と呼ばれ、OpenAIの過去のエージェントツールの複数の機能を組み合わせています。具体的には、ウェブサイト上をクリックする機能や、複数のウェブサイトから情報を合成して研究報告を作成する機能が含まれています。ユーザーは自然な言語でChatGPTに指示を出すことで、このエージェントと対話できるとしています。
ChatGPTエージェントは、OpenAIのPro、Plus、およびTeamプランの加入者向けに木曜日から提供される予定です。ツールを有効にするには、ChatGPTのツールメニューから「エージェントモード」を選択することができます。
このChatGPTエージェントの導入は、ChatGPTを単なる質問応答のツールから、ユーザーのために行動を起こしタスクを委任できるエージェント製品へと進化させるOpenAIの最も大胆な試みとされています。これまで、OpenAIや他のシリコンバレーの企業は、同様のAIエージェントを数多く発表してきましたが、これらの初期バージョンのエージェントは複雑なタスクに苦戦してきたということです。
OpenAIは、ChatGPTエージェントがこれまでの製品よりもはるかに高性能であるとしています。この新しいエージェントは、ChatGPTコネクタを通じてGmailやGitHubなどのアプリを接続し、ユーザーの指示に関連する情報を見つけることができるということです。また、APIを使用して特定のアプリにアクセスすることも可能です。
OpenAIは、ChatGPTエージェントを用いて「4人分の和朝食の材料を計画し購入する」や「3つの競合他社を分析しスライドデッキを作成する」といったタスクを実行できると提案しています。これには、ウェブサイトを解析し、行動計画を立て、ツールを使用する必要があり、これまでのエージェントでは対応が難しかったとされています。
ChatGPTエージェントの基盤となるモデルは、複数のベンチマークで最先端の性能を発揮しているとOpenAIは述べています。例えば、「Humanity's Last Exam」では、41.6%のスコアを記録しており、これは過去のモデルの約2倍に相当します。
安全性についても配慮されているということです。特に生物・化学兵器に関連する分野では、OpenAIのPreparedness Frameworkに基づき「高能力」として指定されており、新たなリスクを軽減するための新しい安全策が導入されています。
具体的な安全策としては、リアルタイムで動作するモニターがあり、ユーザーの入力を分類し、生物学に関連するかどうかを判断するということです。さらに、ChatGPTエージェントのメモリ機能は無効化されており、悪用を防ぐための措置が取られています。
このエージェント技術は、現実世界での能力がどれほどのものかはまだ不明ですが、OpenAIはより高度なモデルを開発し、AIエージェントの約束を果たすことができるとしています。
