arXiv (CV)AI
TITLE_JA: エッジデバイス向け物体検出の動的モデル切り替え技術「RAMS」
RAMS: Resource-Adaptive and Detection-Conditioned Model Switching for Embedded Edge Perception
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
エッジコンピューティング環境での物体検出は、推論の遅延と検出精度のバランスを取ることが難しい課題です。特に組み込みハードウェア上では、デバイスのリソース状況が刻々と変わる中で、安定した性能を維持する必要があります。この問題を解決するため、研究者らは「RAMS」(Resource-Adaptive and Detection-Conditioned Model Switching)という軽量なランタイムコントローラを開発しました。
RAMSは、デバイスの負荷状況をリアルタイムで監視し、アイドル状態の動作から切り替え閾値を自動的に調整します。その上で、YOLOv8の3つのバージョン(NANO/SMALL/MEDIUM、入力画像サイズは各々320/416/640ピクセル)の間で動的にモデルを切り替えます。モデルの再読み込みに伴う遅延が生じない点が特徴です。同時に、脆弱な道路利用者(VRU)の検出直後に過度に性能の低いモデルへ切り替わることを防ぐ、検出条件付きの2つの切り替えポリシーが実装されています。
研究チームはVRU-Weighted Accuracy Score(SWAS)という新しい評価指標も提案しました。この指標は、正解データなしでオフライン環境でのポリシー比較を可能にします。Raspberry Pi 5、x86ラップトップ、Jetson Orin(ONNX/TensorRT実行環境)での実験により、同じコントローラ方程式が37倍の遅延範囲で動作することが確認されました。Jetson Orin上の高負荷環境では、safety2ポリシーが平均3.41ミリ秒の推論遅延を実現し、固定的にMEDIUMモデルを使用した場合の5.6倍高速化を達成しました。VRU検出時には選択的にSMALLおよびMEDIUMモデルをロックすることで、プロキシ精度の74%を維持しています。検出条件付き切り替えにより、SWASはオラクルスコアリング下で25.4%、検出器由来スコアリング下で47.3%向上しました。