arXiv (Robotics)AI
PLUME:マルチフィンガーハンド操作のための確率的潜在統一世界モデルとパラメータ推定
PLUME: Probabilistic Latent Unified World Modeling and Parameter Estimation for Multi-Finger Manipulation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
ロボットハンドによる器用な多指操作は、物体の形状、姿勢、摩擦係数といった物理パラメータに対して非常に敏感である。シミュレーション環境では既知のパラメータ値で大規模なデータ収集が可能だが、実際の展開時には真のパラメータと動力学が未知のままとなり、不確実性への対応が課題となる。従来のドメインランダミゼーション手法では、ドライバーの回転といった精密なタスクには不十分である可能性がある。なぜなら、操作戦略そのものが特定のパラメータ値に応じて変わる必要があるからだ。
このような課題を解決するために、研究チームはPLUME(Probabilistic Latent Unified World Modeling and Parameter Estimation)を提案した。このワールドモデルは、パラメータ値に関する信念の進化と、それらのパラメータを条件とした システム動力学を同時に学習する。提案手法は、部分的に観測可能な変数の関数である報酬とともに、複数の質的に異なる物理パラメータを表現する潜在空間を学習する。これにより、再トレーニングやファインチューニングではなく、オンラインでのパラメータ推定を通じて、ワールドモデルを真の動力学に効率的に適合させることが可能になる。
シミュレートされたドライバー回転、バルブ回転、バケット持ち上げ、ディスク弾きタスクに加えて、実ハードウェアでのドライバー回転タスクにおいて評価した結果、PLUMEはシミュレーション学習されたポリシーのゼロショット転移に成功し、最先端のオフライン強化学習およびワールドモデル拡張行動模倣ベースラインを上回る性能を実現した。