arXiv (CV)AI
TITLE_JA: SEMIR:細線構造のセグメンテーションのための位相保持グラフマイナー
SEMIR: Topology-Preserving Graph Minors for Thin-Structure Segmentation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
電力線、ひび割れ、車線標示など、幅1~3ピクセルの細線構造の画像セグメンテーションは、従来の手法では大きな課題を抱えていました。標準的なパッチベースの表現手法は連続構造を分断し、従来のスーパーピクセル法は細い対象物を背景に統合してしまうため、構造の接続性を保つことが困難だったのです。
新しく提案されたSEMIRフレームワークは、この問題を根本から解決する革新的なアプローチを採用しています。ピクセル格子を、収縮基準の下で細線構造の接続性を保持するパラメータ化グラフマイナーに置き換えることで、従来の制限を克服しました。このグラフマイナーは数百万ピクセルを数十~数百の境界整列スーパーノードに縮約でき、パッチ処理なしで21メガピクセルまでのスケールでのフル解像度推論を実現します。
SEMIRのパイプラインでは、軽量なグラフニューラルネットワーク(GNN)が縮約されたグラフを分類し、正確なマップが予測をピクセル解像度に昇華させます。このアーキテクチャは全てのデータセットで同一の設定を使用しながら、電力線データセット(TTPLA)、舗装ひび割れデータセット(CrackSeg9k)、航空写真車線標示データセット(SkyScapes Lane)において、従来の専用ベースラインと同等かそれ以上の性能を発揮します。DiceスコアやIoU、Boundary F1メトリクスで優れた結果を達成するとともに、マスク断片化をSLIC比で少なくとも4.6倍削減しました。