arXiv (AI)AI
AURA:ロボット政策のためのアクション・ゲーテッド・メモリ(一定のVRAM消費)
AURA: Action-Gated Memory for Robot Policies at Constant VRAM
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
ロボット工学における推論タスクは、データセンターの推論とは大きく異なる要件を持っています。データセンターの推論は多くの短い要求をバッチ処理し、注意キャッシュ(KV-cache)を活用して効率化できますが、ロボットなどの具現化エージェントは限られたエッジハードウェア上で長時間の連続的なエピソードを実行する必要があります。こうした環境では、高速メモリや不揮発性メモリが不足しており、メモリ書き込みが計算よりもボトルネックになりやすいという課題があります。
新しく提案されたAURA-Mem(Action-Utility Recurrent Adaptive Memory)は、このロボット工学の要件に特化した記憶メカニズムです。凍結されたビジョン・言語・アクション基盤モデルを、定サイズの再帰的メモリと学習可能なゲート機構でラップします。このゲートの核となる特徴は、現在の観測が次のアクションを変える場合にのみメモリに書き込むという「沈黙を知るメモリ」のコンセプトです。従来の再構成ベースのメモリとは異なり、ゲートは閉ループのアクション・エラー信号に対して直接訓練されます。
実験結果は顕著な効果を示しています。推論状態は地平線に関わらず4,224バイトの一定サイズで保たれ、100,000ステップではKV-cacheの約6,061倍も小さくなります。制御された合成ベンチマークでは、AURA-Memはメモリ書き込みを5.19~6.13倍削減しながら最良のO(1)ベースラインと同等の精度を維持しています。実装されたOpenVLA-OFT 7Bモデルを使用したLIBERO-Longでの評価では、ゲート機構は成功率を低下させず、基本政策(0.233)と同等の0.233の成功率を達成しながら、メモリ書き込みを7倍削減しています。この研究はロボット推論の効率化と実用性向上における重要な進展を示しています。