マイクロソフトは、AIエージェントを試験するための新しいシミュレーション環境を発表しました。アリゾナ州立大学と共同で行われたこの研究は、現在のエージェントモデルが操作されやすい可能性があることを示しています。AI企業がエージェントの未来を実現する速度についても新たな疑問を提起しています。
このシミュレーション環境は「マジェンティック・マーケットプレイス」と名付けられ、AIエージェントの行動を実験するための合成プラットフォームとして構築されています。典型的な実験では、顧客エージェントがユーザーの指示に従って夕食を注文しようとし、様々なレストランを代表するエージェントがその注文を獲得しようと競争します。
チームの初期の実験では、100の顧客側エージェントと300のビジネス側エージェントが相互作用しました。市場のソースコードはオープンソースであるため、他のグループが新しい実験を行ったり、結果を再現したりするのは容易です。
マイクロソフトリサーチのAIフロンティアズラボのマネージングディレクターであるエセ・カマー氏は、この種の研究がAIエージェントの能力を理解するために重要であると述べています。「これらのエージェントが互いに協力し、交渉することで世界がどのように変わるかについて、本当に疑問があります」とカマー氏は言います。「これらのことを深く理解したいと考えています。」
初期の研究では、GPT-4o、GPT-5、Gemini-2.5-Flashなどの主要なモデルを調査し、いくつかの驚くべき弱点を発見しました。特に、企業が顧客エージェントを操作して製品を購入させるために使用できるいくつかの技術が見つかりました。顧客エージェントが選択肢を増やされると、エージェントの注意空間が圧倒され、効率が低下することも観察されました。
「これらのエージェントには多くの選択肢を処理するのを手伝ってほしいのです」とカマー氏は言います。「現在のモデルは、選択肢が多すぎると本当に圧倒されてしまうことがわかっています。」
エージェントは共通の目標に向けて協力する際にも問題に直面し、どのエージェントがどの役割を果たすべきかが不明確でした。モデルに明確な指示を与えるとパフォーマンスが向上しましたが、研究者たちはモデルの基本的な能力が改善の余地があると見ています。
「モデルには指示を与えることができますが、それが協力能力を試すことであれば、これらのモデルがデフォルトでその能力を持っていると期待したいです」とカマー氏は述べています。
