ネオヒューマノイドロボットを開発する1X社は、新しいAIモデル「1Xワールドモデル」を発表しました。このモデルは、現実世界の動態を理解し、ロボットが自ら新しい情報を学ぶのを支援するということです。
この物理ベースのモデルは、映像とプロンプトを組み合わせてネオロボットに新しい能力を付与します。1X社によれば、映像を使用することで、ネオロボットは事前に訓練されていない新しいタスクを学習できるということです。
この発表は、1X社がネオヒューマノイドを家庭に導入する準備を進める中で行われました。同社は10月にヒューマノイドの予約注文を開始し、今年中に出荷する計画です。1X社の広報担当者は、出荷時期や注文数についての詳細は明らかにしませんでしたが、予約注文は予想を上回ったとしています。
1X社の創業者兼CEOであるベーント・ボルニッチ氏は声明で、「長年にわたりワールドモデルを開発し、ネオのデザインを人間に近づけてきた結果、ネオはインターネット規模の映像から学び、その知識を物理世界に直接適用できるようになりました」と述べています。「プロンプトを新しい行動に変える能力を持ち、事前の例がなくても、ネオはほぼすべてのことを自ら習得する能力を持つ出発点となります」としています。
ただし、プロンプトを新しい行動に変えるという主張は、必ずしも正確ではないとされています。例えば、ネオに車を運転するよう指示しても、すぐに平行駐車ができるわけではありませんが、何らかの学習は行われているということです。
1X社は、ワールドモデルが現在のネオロボットに新しいタスクをすぐに実行させるものではないと明言しています。代わりに、ロボットは特定のプロンプトに関連する映像データを収集し、それをワールドモデルに送り返します。そのモデルはロボットのネットワークにフィードバックされ、物理世界の理解を深め、より多くの知識を与える方針です。
また、ユーザーにネオが特定のプロンプトに対してどのように行動しようとしているかの洞察を提供します。このような行動情報は、1X社がこれらのモデルを訓練し、ロボットが初めてのプロンプトにも反応できるようにするのに役立つということです。
