arXiv (Robotics)AI
大規模言語モデル強化型の自動駐車軌跡計画フレームワーク「ParkingTransformer」
ParkingTransformer: LLM-Enhanced End-to-End Trajectory Planning for Autonomous Parking
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
自動運転における駐車は、完全な自動化の実現に向けた重要な課題の一つです。従来の駐車自動化手法は、ブラックボックス性が強く、高レベルのセマンティック理解と解釈可能性に欠けており、一般道路から目的地までの長距離自動駐車のシームレスな実現を妨げてきました。このような課題に対処するため、研究チームは大規模言語モデル(LLM)を活用した新しい駐車軌跡計画フレームワーク「ParkingTransformer」を提案しました。
本手法の特徴は、マルチビュー知覚とLLMのシーン理解能力を組み合わせることにあります。軌跡クエリとLLMの暗黙的状態特徴を組み合わせることで、システムは履歴情報と生のセンサーデータと直接相互作用し、計画軌跡を出力します。これにより、高解像度なBird's-View(BEV)表現の必要性が排除されます。一方、LLMの空間推論能力の不十分さを補うため、3D位置エンコーディングが導入され、空間幾何学的認識が明示的に注入されます。
さらに、固定ウィンドウストリーミング機構が設計され、履歴情報処理が大幅に改善され、長期の時系列処理効率と推論速度が向上します。粗から細へのデコーディング戦略も採用され、軌跡精度が段階的に向上されます。
実験評価では、CARLAシミュレータで61.32の走行スコアを達成し、実世界の車両プラットフォームで平均88.70%の成功率を達成しました。これらの結果は、提案されたアルゴリズムの実用性と有効性を検証し、自動駐車技術が実用段階へ向かっていることを示唆しています。