arXiv (Robotics)AI
CLAW:敵対的潜在正則化による連続潜在行動世界モデルの学習
CLAW: Learning Continuous Latent Action World Models via Adversarial Latent Regularization
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
機械学習における世界モデルの構築は、ロボットや自律エージェントが環境を理解し行動するために重要な課題です。今回発表されたCLAWは、このプロセスを革新する新しいフレームワークで、行動ラベルがない動画から直接、連続的な潜在行動表現と世界モデルを同時に学習することができます。
従来の学習手法では、エージェントの具体的な行動データや注釈が必要でしたが、CLAWは敵対的潜在正則化と拡散ベースの動画生成技術を活用することで、この制約を克服しました。視覚観測のみから、エージェントがどのような行動を取ると環境がどう変化するかを推論できるようになります。潜在行動モデルと世界モデルを同時に訓練することで、意味のある構造化された行動表現を習得しながら、豊かで予測性の高い環境ダイナミクスをモデル化します。
CLAWの実用的な応用は多岐にわたります。模倣学習の領域では、生の動画から抽出された潜在行動を用いて動作複製(ビヘイビアクローニング)が可能になります。また計画立案では、生成された潜在行動の列を実行可能な行動にマッピングすることで、目標達成を実現できます。
様々なタスクと具体例を用いた実験を通じて、CLAWが意味的に有意義な潜在行動表現を生成し、効果的な行動転移を支援し、観察からの計画と模倣学習を実現することが実証されました。既存手法を上回る性能を持つこのフレームワークは、ロボティクスや自律意思決定の分野における大きな前進を示しています。