arXiv (Robotics)AI
LiMoDE:動的エキスパート混合モデルの視点からロボット生涯操作タスクを再考する
LiMoDE: Rethinking Lifelong Robot Manipulation from a Mixture-of-Dynamic-Experts Perspective
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
ロボットが過去の知識を活かしながら継続的に新しいタスクに適応できる汎用ロボットの開発は、ロボティクス分野における重要な課題です。これまでの研究では、単一タスク適応に向けてパラメータ効率的なファインチューニングを用いることで、破滅的忘却(catastrophic forgetting)問題を緩和してきました。しかし既存の手法は再利用可能なスキルを効果的に抽出できず、異なるスキル間の相互作用をうまくモデル化できていません。近年のアプローチではプロンプト学習を試みていますが、本論文はこれとは異なる建築的視点から、生涯ロボット操作のための新しい「LiMoDE(Lifelong Mixture of Dynamic Experts)」を提案しています。
提案手法は2段階の学習スキームで構成されています。まず第一段階の多タスク事前学習では、動的MoE構造を導入し、モーション情報に基づいて異なる数の異種エキスパートが活性化され、様々な短期的操作タスクに対応します。次に第二段階のタスク適応フェーズでは、新規タスク対応時に生涯エキスパートを学習し、凍結されたエキスパートと動的に組み合わせることで、適応時の知識移行を促進する生涯MoE適応メカニズムを設計しています。
LiMoDEはシミュレーション環境の生涯学習ベンチマークと実世界タスクの両方で評価されました。広範な実験結果は、適度な数の追加学習パラメータと推論オーバーヘッドで優れたパフォーマンスと強力な生涯適応能力を達成できることを実証しており、ロボットが継続的に新しい操作スキルを習得しながらも過去の知識を保持できる可能性を示しています。