arXiv (CV)AI
TITLE_JA: ビデオベースの人物再識別における時空間専門家学習
Spatial-Temporal Expert Learning for Video-based Person Re-identification
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
ビデオベースの人物再識別(Re-ID)は、クエリビデオクリップからギャラリービデオクリップ内の同一人物を検索する技術です。この課題を解決するためには、特に外見が似ている人物を区別する際に、細粒度の特徴情報を効果的に活用することが重要となります。本研究では、新たな入力適応的な拡張可能な専門家モジュールを提案し、細粒度情報の探索能力を強化しています。
従来の手法ではデータセット内の全サンプルを用いてネットワークパラメータを更新していましたが、本研究ではアプローチを変え、類似サンプルのみを含む特定の部分集合内で専門家を訓練することで、これらの類似サンプル間の微細な違いを活用する能力を促進させています。このモジュールには二つのメカニズムが組み込まれています。まず入力適応的専門家選択メカニズムは、類似サンプルの部分集合に対して動的に専門家群を活性化し、細かな違いの発見を促します。次に時空間選択メカニズムが、空間的・時間的側面における細粒度の違いに対する感度をさらに高め、異なる入力サンプルに対して動的にこれらの情報を活用することを可能にしています。
さらに本研究では、専門家モジュールを支援するための拡張可能なスキームを設計しており、このスキームにより必要に応じて柔軟に新しい専門家を追加することができます。提案手法は複数の大規模データセット上で優れた性能を達成しています。