arXiv (AI)AI
ニューロシンボリック・ドライブ:ルール基盤の忠実な推論による自動運転VLA
Neuro-Symbolic Drive: Rule-Grounded Faithful Reasoning for Driving VLAs
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
自動運転技術の分野で、視覚言語モデル(VLA)を用いた推論能力の向上が注目されています。Chain-of-Thought(CoT)推論を組み込んだ運転VLAモデルは、事前学習済みの視覚言語表現を活用し、中間判断を自然言語で露出させることで魅力的ですが、現在のモデルでは推論内容が実際の運動計画と因果関係を保つために必要なステップバイステップの意思決定セマンティクスが不足していることが課題でした。
新しく提案されたNeuro-Symbolic Driveフレームワークは、古典的なルールベース・プランナーから直接抽出したルール基盤の推論トレースで、運転VLAを教師付き学習させる革新的なアプローチです。このフレームワークの核となる観察は、ルールベース・プランナーがシンボリックAIシステムとして既に実行可能な推論エンジンとして機能しているという点です。これらのプランナーは安全制約をアクティブに推論し、候補となる操舵動作を探索し、最終的な軌跡を選択します。研究チームはシミュレーター内でこれらのプランナーを計装化し、実行された軌跡とルール評価のステップごとの内部判断トレースの両方をキャプチャしました。
各トレースは構造化されたルール基盤の推論にシリアライズされ、軌跡とペアリングされてQwen3.5-4Bの運転VLAをファインチューニングします。重要な点として、これらのトレースはアクションを決定するプランナー状態から直接導出されるため、事後的な調整ではなく、構造上の結合により推論が運動生成と確実に結合されます。シミュレーターで生成されたベンチマークでは、詳細なルール基盤の推論により、3カメラ認識下ではADE@3sが0.47から0.26に、ミス率が8.30%から6.40%に低下し、8カメラ認識下では0.54から0.26および10.13%から5.99%に改善されました。このアプローチは、ニューロシンボリック計画ロジックを構造化された教師信号に変換する重要な進展を示しています。