arXiv (NLP)AI
TITLE_JA: EXPO-SQL:テキストからSQLへの変換における実行ベースの句レベル方針最適化
EXPO-SQL: Execution-based Clause-level Policy Optimization for Text-to-SQL
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
自然言語でデータベースクエリを実行できるテキストからSQL(Text-to-SQL)への変換技術は、ユーザーのアクセシビリティを大幅に向上させる重要な研究分野です。近年、この分野では大規模言語モデル(LLM)に基づいた強化学習(RL)を採用し、実行フィードバックを学習に活用する手法が増えています。しかし既存のRL手法には根本的な課題がありました。それは、SQL クエリ内のすべての句に対して均一なクエリレベルの報酬を割り当てるため、正しい句と誤った句を区別せず同じように扱ってしまうという問題です。この粗粒度な報酬設計では、正確なSQL生成のための学習シグナルが不十分になってしまいます。
このような課題に対処するため、研究チームが提案したのが EXPO-SQL(EXecution-based clause-level Policy Optimization for Text-to-SQL)です。この手法の最大の特徴は、句レベルの報酬を通じてきめ細かい教師信号を提供することにあります。句レベルの報酬を割り当てるため、EXPO-SQL は実行結果を分析することで誤った句を特定します。具体的には、エラーメッセージや句単位の段階的実行結果を活用して、どの句が問題なのかを正確に判定するのです。
広く使用されているText-to-SQLベンチマークでの実験によって、EXPO-SQLは従来の教師あり微調整、プロンプティング、RL系手法と比較して、句レベルのきめ細かい学習を通じて顕著に優れた性能を発揮することが実証されました。この研究成果はGitHub上で公開されており、今後のText-to-SQL技術の発展に貢献することが期待されています。