arXiv (NLP)AI
メディアバイアス検出の新手法「HierBias」:文脈を考慮した階層的アプローチで検出精度を向上
HierBias: Context-Conditioned Hierarchical Media Bias Detection with Multi-Task Type Classification
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
メディアの偏向報道は情報社会における重大な課題であり、公正で均衡のとれた情報発信を確保するためには、その検出が不可欠です。従来のメディアバイアス検出手法は文単位で独立して分類を行い、複数の文間の関連性を無視してきました。しかし人間の注釈者は文脈全体を自然に活用して判断しており、この点が既存手法の限界となっていました。
今回発表された「HierBias」は、このギャップを埋める革新的なアプローチです。文書全体の文脈を明示的にモデル化し、「文脈条件付きバイアス確率」という新しい概念を導入しています。理論的には、文間の相互情報量がゼロでない場合、文書の文脈を活用することがベイズ誤差を厳密に低減できることを証明しており、これが手法の有効性を保証しています。さらに、バイナリ分類(バイアスの有無)と細粒度の4クラス分類(バイアスの種類)を同時に学習する多タスク学習により、限られたアノテーション済みコーパスでのサンプル効率が向上することも理論的に示されています。
HierBiasのアーキテクチャは、文レベルの処理にRoBERTaエンコーダを採用し、文間の情報統合には交差文Transformerアグリゲータを使用します。二つの出力ヘッドで、バイアス検出と種類分類を並行して実施します。評価実験ではBABEおよびBASILデータセットで実施され、F1スコア0.853、MCC 0.723を達成し、従来の最先端手法を+2.6%のF1スコアと+4.3%のMCCで上回りました(マクネマー検定、p < 0.05)。各コンポーネントの有効性はアブレーション実験により独立かつ一貫して確認されています。