arXiv (CV)AI
COD10K-C:自然な画像劣化下での迷彩物体検出ロバストネスベンチマーク
COD10K-C: Benchmarking Robustness of Camouflaged Object Detection Under Natural Image Corruptions
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
迷彩物体検出(カモフラージュされた物体を画像から検出する技術)は急速に発展していますが、既存のベンチマークは理想的なクリーンな画像のみで評価されるという課題がありました。しかし実世界のカメラは、ブラー、センサノイズ、天候の影響、圧縮アーティファクトなど、様々な画像劣化に直面しています。このギャップに対応するため、研究チームはCOD10K-Cという新しいロバストネスベンチマークを開発しました。このベンチマークは既存の大規模データセットCOD10Kをベースに、8種類の劣化タイプと5段階の重大度レベルを含み、合計40の評価条件と81,040の評価ペアを提供しています。
評価の結果、SINet-v2、PFNet、ZoomNetという3つの人気のある迷彩物体検出モデル、および軽量モデルのRobustCODLiteの性能差が明らかになりました。すべてのモデルは劣化画像で顕著なパフォーマンス低下を示し、特にモーションブラーとガウシアンブラーが最も大きな悪影響を与えることが判明しました。SINet-v2はモーションブラーの下で18.5ポイントのDiceスコア低下を記録した一方、明度とフォグはそこまで有害ではありませんでした。
RobustCODLiteは、腐敗拡張、周波数優先分岐、不確実性一貫性損失を組み合わせた設計により、劣化下でもクリーン画像時のDiceスコアの92.3%を維持しました。これはSINet-v2の87.7%、ZoomNetの84.8%、PFNetの84.1%と比較して大幅に優れています。最も困難な劣化条件下では、RobustCODLiteはクリーン画像で高性能なモデルと同等かそれ以上の結果を達成しています。研究チームはCOD10K-C GitHubリポジトリを公開し、ロバストな迷彩物体検出に関する今後の研究を支援する予定です。