arXiv (CV)AI
Plan2Map:計画記録から地理空間境界を復元するマルチモーダルベンチマーク
Plan2Map: A Multimodal Benchmark for Document-Grounded Geospatial Boundary Reconstruction from Planning Records
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
英国の都市計画記録から地理空間の境界を自動復元する課題に取り組む新しい研究が発表されました。計画記録は特定の地理的区域に対する制限を定義していますが、その文書には機械が読み取れる形式の境界データが含まれていないことがほとんどです。研究チームは、この問題に対処するためにPlan2Mapという208件の事例から構成されるマルチモーダルベンチマークを開発しました。
Plan2Mapのシステムでは、計画文書のテキスト、スケジュール表、地図画像、地図ラベル、境界注釈といった複数の情報源から、有効な地理空間境界を再構成する必要があります。参照データとしてGeoJSON形式の正解境界が用意されており、システムの性能評価に使用されます。研究チームが提案したGeoPlanAgentは、証拠抽出、位置特定、地図登録、境界セグメンテーション、投影、検証といった6つの段階にタスクを分解する文書グラウンディング型のジオスパシャルツール統合システムです。
GeoPlanAgentはPlan2Map上で平均IoU(Intersection over Union)0.736、中央値IoU 0.904を達成し、予測の67.8%が0.8以上のIoUに到達しました。これは従来の視覚言語モデル(VLM)を直接GeoJSONに変換するベースラインを大幅に上回る性能です。診断分析の結果、直接的なVLM予測は信頼性に欠け、残存エラーは主に位置特定と地図登録に集中していることが明らかになりました。教師あり学習による境界セグメンテーションはピクセルレベルのマスク品質を大幅に改善しています。