arXiv (Robotics)AI
AgenticDiffusion:ビジョンベースのUAV自律航行のための拡散型経路計画システム
AgenticDiffusion: Agentic Diffusion-based Path Planning for Vision-Based UAV Navigation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
屋内でのドローン(UAV)自律航行は、限定的な視野範囲で効率的な探索、シーン理解、信頼性の高い軌跡実行を必要とする複雑な課題です。既存のビジョンベース航行フレームワークの多くは単一視点の観測に依存しているため、物体の遮蔽、ターゲットの視認性、シーン全体の構造を推論する能力に制限がありました。今回発表されたAgenticDiffusionは、このような課題に対する革新的なソリューションとして開発されました。
本フレームワークは、言語ガイダンス、オープンボキャブラリーなターゲット検出、ビジョンベースの拡散型計画、そしてNMPC(非線形モデル予測制御)を統一されたドローン航行パイプラインの中で統合するマルチビュー型のナビゲーションシステムです。自然言語指示と同期された一人称視点(FPV)および上方視点の観測データを入力として、フレームワークは航行に最適な視点を決定し、軌跡実行前にミッション計画を生成します。
オープンボキャブラリーグラウンディングモデルを使用してターゲットを特定した後、視点固有の拡散型プランナーがドローン実行用のナビゲーション軌跡を生成します。相補的な複数視点を活用することで、本フレームワークはターゲット探索の繰り返しを削減し、雑然とした屋内環境での航行効率を向上させます。
実装と評価は、適応的視点選択、マルチステージミッション実行、長時間航行、安全な着陸地点選択を含む4つの実世界ドローン航行シナリオで検証されました。実験結果は40回の実世界試行でのミッション成功率80%を示し、拡散型プランナーは100%の軌跡生成成功率を達成しています。