arXiv (CV)AI
MapDreamer:航空画像から車線レベルの地図を生成する拡散モデル
MapDreamer: Aerial Imagery Conditioned Latent Diffusion for Lane-Level Map Generation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
自動運転技術の発展に伴い、高精度な地図データの自動生成が重要な課題となっています。従来、道路の車線レベルの地図作成は膨大な手作業を必要としていました。このたび、arXivで発表された「MapDreamer」は、単一の航空画像から車線レベルのベクトルマップを直接生成できるジェネレーティブな拡散モデルです。
MapDreamerの仕組みは、変分オートエンコーダ(VAE)を用いて車線の中心線とその位相的関係をコンパクトな潜在表現として学習することから始まります。その後、トランスフォーマーベースの潜在拡散モデルがこれらの情報からグラフ構造を予測します。生成された地図が観察された風景に確実に適合するよう、クロスアテンション機構を通じて各ノイズ除去ステップに密集した航空画像特徴を条件付けしています。
シーンによって異なる車線数に対応するため、車線の基数モジュール(lane cardinality module)とゴーストレーン潜在(background ghost lane latents)を採用しました。後者は学習可能なバッファとして機能し、拡散処理中のスロット崩壊を防止します。さらに、ローカルタイルをシティスケールの地図に統合する際に、エンコードされた車線境界を通じて接続性を保持するスライディングウィンドウ全体グラフ集約戦略を導入しています。
Argoverse 2から派生したUrbanLaneGraphデータセットを用いた実験では、非生成型のベースラインと比べて幾何学的および位相的な忠実度が向上することが示されました。この手法により、自動運転システムのための地図生成プロセスが大幅に効率化される可能性があります。