arXiv (CV)AI
SelectAnyTree:3D森林LiDARポイントクラウド向けプロンプト可能なインスタンスセグメンテーションモデル
SelectAnyTree: A Promptable Instance Segmentation Model for 3D Forest LiDAR Point Clouds
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
森林モニタリングが詳細な3次元測定へとシフトする中で、LiDARポイントクラウドからの自動インスタンスセグメンテーションの重要性が急速に高まっています。しかし、樹木インスタンスのラベルデータが極めて不足しているため、研究の進展が大きく制約されているのが現状です。1ヘクタールの森林には数百万個のポイントと複数の樹冠が重なり合っており、生データから手作業でアノテーションを行うことは非常に手間がかかり、かつ誤りが生じやすいという課題があります。
これまで自動前処理によるセグメンテーション結果から修正アノテーションを作成してきましたが、対話的なAI支援がなく依然として大きなコストを要していました。こうした背景から、研究チームはSegment Anythingなどの基礎セグメンテーションモデルが採用するプロンプト可能なパラダイムにインスピレーションを受け、SelectAnyTreeを開発しました。このモデルは、わずか数回のクリック操作で3Dポイントクラウド内の個別の樹木を正確にセグメンテーションできるインタラクティブなシステムです。
SelectAnyTreeの核となるのは、クリックを単一のコンテンツクエリに変換するClick-to-queryプロンプトエンコーダと、樹頂点を幾何学的・生態学的ガイドとして提供するCanopy Height Model(CHM)ガイド付きファースト プロンプトの2つのコンポーネントです。これらの要素から生成されたプロンプトクエリは、状態空間クエリデコーダによって単一の樹木マスクに変換され、大規模な森林シーンにおいて線形時間複雑性で長距離コンテキストを効率的にキャプチャします。
7つの異なる森林地域と独立した検証データセットでの評価結果から、SelectAnyTreeは訓練領域を超えた強い汎化能力を示しており、単一クリックで78.2のIoU(Intersection over Union)を達成し、従来の最強プロンプト可能ベースラインを24.8ポイント上回る性能を発揮しています。また、より少ないパラメータ数と推論時間で精度目標を達成するなど、高い効率性も実証されています。