arXiv (CV)AI
メモリ拡張LSTM オートエンコーダを用いたIMUセンサフュージョンによる教師なし活動認識
Memory-Augmented LSTM Autoencoder for Unsupervised Activity Recognition with IMU Sensor Fusion
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
ヘルスケア監視とリハビリテーションの分野において、慣性計測ユニット(IMU)センサを活用した人間活動認識(HAR)は極めて重要な役割を果たしています。本研究は、深層学習の発展にもかかわらず依然として存在する課題に取り組んでいます。その主な課題とは、ラベル付きデータへの依存性、複数センサの融合処理の複雑さ、および教師なし手法の時空間依存性の捕捉能力の限界です。これらの問題は、ノイズを含むデータ、活動の重複、ラベルの欠落が存在する現実世界のシナリオでは特に顕著となります。
研究チームは、メモリ拡張オートエンコーダを用いた完全教師なしの時空間特徴融合フレームワークを提案しました。このフレームワークは、複数センサのIMUデータを短い時間窓で処理することで活動表現を強化し、リアルタイムアプリケーションを可能にします。積層オートエンコーダを通じて階層的な静的特徴を抽出し、これらをセンサ内およびセンサ間で融合させます。その後、シーケンス・ツー・シーケンス型のLSTMオートエンコーダが、ラベルなしで過去の運動パターンを組み込みながら、これらの特徴を時間的に洗練させます。
研究では、短い時間窓の制約下で特徴の分離可能性を最大化する構成を特定するため、主要なハイパーパラメータを分析しています。DaLiAcおよびPAMAP2データセットで現実的なクラス間ウィンドウ分割を用いた評価により、提案手法はそれぞれ96.6%と98.4%の精度を達成し、教師ありベースラインと教師なしアプローチの両方を上回りました。短い時間窓という制約にもかかわらず、特徴の分離可能性を最大9%向上させることができています。
現実的なクラス間分割により精度が約7%低下していますが、これは実世界の活動遷移と実用的な関連性をより良く反映させるために意図的に採用されたものです。本フレームワークは、ラベル付きデータが限定的である実際の医療・リハビリテーション応用において、実用的な価値を持つと考えられます。