arXiv (NLP)AI
TITLE_JA: CoRA:信頼性の高い思考の鎖推論のための信頼度と根拠の整合性
CoRA: Confidence-Rationale Alignment for Reliable Chain-of-Thought Reasoning
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
大規模言語モデル(LLM)による推論の精度向上において、思考の鎖(Chain-of-Thought、CoT)推論は有効な手法として知られています。しかし、モデルが高い信頼度で答えを提示していても、それを支える根拠が表面的には妥当に見えながら、実は不完全であったり十分な根拠に基づいていない場合があります。このような信頼度と根拠のズレが、AIシステムの信頼性を損なう重大な問題となっています。
新しい研究「CoRA(Confidence-Rationale Alignment)」は、モデルの答えに対する信頼度が、実際に生成された根拠によって正当化されているかどうかを検証することに焦点を当てています。研究チームはGRPOベースの強化学習フレームワークを開発し、答えの正確性、提示された答えの確率、そして根拠の質を同時に報酬として機能させるアプローチを採用しました。この評価では、正解を明かさない形で、根拠の接地性、一貫性、タスクとの適合性、選択した答えとの結びつきをルーブリック(評価基準)に基づいて判定しています。
MedQA、MathQA、OpenBookQAの3つのベンチマークデータセットで、複数のオープンウェイトLLMを用いた実験を実施したところ、提案手法は信頼度と根拠の不整合エラーを最大26.51%削減することに成功しました。これは未調整のモデルやSFT(教師あり微調整)、正確性のみを目指したGRPOと比較した結果です。同時に、答えの正確性は競争力のあるレベルを維持しながら、モデルのキャリブレーション(予測の信頼度調整)も向上させています。これらの結果は、信頼性の高いCoT推論には、自信のある答えだけでなく、それを実質的に支える説得力のある根拠が不可欠であることを示唆しています。