arXiv (Robotics)AI
協働作業を学ぶ:暗黙的な人間ロボット協働のための協調型ビジョン言語行動モデル
Learning to Assist: Collaborative VLAs for Implicit Human-Robot Collaboration
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
人間とロボットが協力して作業を行うことで、互いの強みを活かしてタスク効率を向上させる人間ロボット協働(HRC)が注目されています。しかし、既存の協働システムの多くは手作業で設計されたパイプラインに依存しており、新しいタスクへの拡張性と柔軟性が限定されていました。
本研究では、模倣学習で端から端まで訓練されたビジョン言語行動(VLA)モデルが協働的な操作作業をサポートでき、実世界での性能に影響を与える主要な要因を特定できることを示しています。研究チームは最先端の2つのモデルを評価し、暗黙的なHRCにおけるアクションチャンキング方式ポリシーの障害モードを発見しました。デモンストレーションアクションリーケージ(潜在的なタスク遷移を跨ぐアクションチャンク)が発生すると、ロボットが人間の準備ができていないのに工具を手渡そうとするなど、早過ぎるアシスト動作を引き起こす可能性があります。
この問題は実行期間が長くなるほど顕著になり、実世界の協働VLAシステムでも発生します。研究チームは推論時間ステアリング法を提案し、ポリシーの性能を維持しながらこれらの誤ったアシスト行動を軽減する方法を開発しました。16人の参加者による長時間の協働組立タスクのユーザー研究を通じて、ステアリング手法により実行期間を延長しながら早過ぎるアシストを軽減でき、より短い実行期間のポリシーと比較して協働が高速化し失敗が減少することが示されました。