arXiv (NLP)AI
TITLE_JA: QIAS 2026:イスラム相続推論に関する共有タスクの概要
QIAS 2026: Overview of the Shared Task on Islamic Inheritance Reasoning
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
イスラム教の相続法に関する複雑な推論能力を評価するため、LREC 2026に併設されるOSACT7ワークショップの一部として、QIAS 2026という共有タスクが組織されました。このタスクは、従来的な質問応答ベンチマークとは異なり、自然言語で記述された事例から端末から端末への推論を行うことに焦点を当てています。システムは、適格な相続人を特定することから各受益者に正しい取り分を割り当てることまで、相続計算プロセス全体を実行する必要があります。
このタスクの評価を支援するため、MAWARITHベンチマークという12,500件のアラビア語相続事例データセットが使用されました。各事例には中間推論ステップと最終的な回答が注釈されており、システムは多段階指標MIR-Eを用いて相続推論の主要段階全体でのパフォーマンスが測定されました。16チームが共有タスクに参加し、プロンプトベースの手法、検索拡張生成、ファインチューニング戦略など様々なアプローチを調査しました。
結果から、イスラム相続法は現在の言語モデルにとって非常に難しいベンチマークであることが明らかになりました。特に正確な法的解釈と構造化された数値推論を必要とする段階において、言語モデルは困難に直面しています。このような高度な法的・宗教的推論は、LLMが習得するために多くの課題を提示するドメインであり、今後のモデル開発における重要な評価指標となります。