arXiv (NLP)AI
因果関係の抽出:金融QAタスクにおける多言語ファインチューニングの活用
Causal Connections: Leveraging Multilingual Fine-Tuning for Financial QA@FinCausal 2026
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
金融テキストから因果関係を抽出することは、市場分析やリスク評価において重要な役割を果たします。HSA_CORALチームによる本研究は、FinCausal 2026共有タスクにおいて、英語とスペイン語の金融ナラティブから抽出的質問応答を通じて因果関係を抽出するアプローチを提案しています。このタスクの特徴は、単なる因果関係の識別にとどまらず、複数言語での正確な抽出能力が求められる点にあります。
研究チームは3つの異なるモデルファミリーを比較検討しました。第一に、多言語BERTを用いたエンコーダーのみのトークンタギング、第二に多言語BARTを利用したエンコーダー・デコーダー生成モデル、そして第三に、Llama 3.1やGPTの変種などのデコーダーのみのLLMです。デコーダーのみのモデルに対しては、プロンプト改良、少数ショット学習デモンストレーション、教師あり学習によるファインチューニングが適用されました。
実験結果から、プロンプティングと少数ショット例は競争力のあるパフォーマンスを示しましたが、教師あり学習によるファインチューニングがもっとも大きな改善をもたらすことが明らかになりました。最高性能のシステムは、英語とスペイン語の統合訓練データでファインチューニングされたGPT-4.1 Miniで、英語サブタスクで最高得点の4.8140を達成し、スペイン語では4.7753でランク3位となりました。これらの結果は、タスク固有の適応と多言語ファインチューニングが、金融因果性QAの言語横断的な転移学習において重要な価値を持つことを示唆しています。