arXiv (ML)AI
TITLE_JA: SPIN:テンソル化ポリシー調整による分散型スウォーム制御
SPIN: Decentralized Swarm Control via Tensorized Policy Coordination
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
リソース制約のあるエッジプラットフォーム上での分散型マルチエージェントスウォーム協調制御は、結合行動空間の指数関数的スケーリングと高遅延通信のオーバーヘッドによって根本的なボトルネックに直面しています。本論文で提案されるSwarm Policy Interference Network(SPIN)フレームワークは、スウォームトポロジーを圧縮テンソルネットワークとしてモデル化することで、これらの制限を回避する新しいアーキテクチャパラダイムです。
SPINの核となるイノベーションは、ローカルマルチエージェントクリークの結合ポリシーテンソルをMatrix Product State(MPS)チェーンに因数分解することにあります。これにより、計算複雑性を指数関数的なO(n^m)から線形のO(m・n・χ²)へと劇的に削減することが可能になります。この数学的最適化により、エッジデバイス上での実行可能性が飛躍的に向上します。
従来のオンライントレーニングループなしに、ローカルな連続空間幾何学と離散的な代数的バックエンドを橋渡しするため、本フレームワークは分離型のハイブリッド神経シンボリック制御パイプラインを導入しています。ローカルのマルチレイヤー神経ネットワークは構造的調整エンコーダとして機能し、オフラインで事前学習されて、手作りの幾何学的記述子を抽象的な環境目標措置へと非線形にマッピングします。実行時には、エッジエージェントはRadon-Nikodým微分をゼロショット重要度再重み付けフィルターとして直接適用することで、瞬時の行動適応を実現します。
提案フレームワークは、ターゲット追跡、分散型分散・領域カバレッジ、および複数目標協調を含む複数のシミュレーションシナリオで検証されています。定性的なテレメトリデータは、統合パイプラインが安定した目標指向運動、分散制約下での反崩壊型空間拡散、および複数目標にわたる構造化サブグループ形成を達成することを実証しており、低消費電力エッジスウォームインテリジェンスへの数学的に根拠のあるアプローチを提供しています。