arXiv (AI)AI
公平性を対称性操作として扱うことでバイアスを検出・軽減する手法
Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
機械学習システムが経済的・社会的に重要な場面で運用される際、システムに組み込まれたバイアスが問題となることが多くあります。本研究は、このバイアスの問題に新たなアプローチを提示しています。研究者らは、バイアスを対称性の破れとして形式化し、分類器が公平であるための条件を定義しました。具体的には、重要な属性(例えば年齢や性別など)を反転させる反事実操作の下で、分類器の出力が不変のままであれば、その分類器は公平であると定義しています。この定義により、バイアスの軽減は本質的に対称性を回復させるプロセスとして位置付けられます。
研究チームは、この理論的フレームワークを実装する際に、損失関数に基づく正則化メカニズムを用いることで対称性を復元しようとしました。異なるレベルのノイズ、相関、バイアスを含む4つの合成データセットで評価した結果、このフレームワークはバイアス違反を90%以上削減することに成功しています。ただし、精度はおよそ5%程度低下するというトレードオフが存在します。
このアプローチの利点として、因果グラフの知識を必要としない点、計算量が少ない点、そしてビットフリップとして定義可能なあらゆる敏感属性に対して汎化可能という点が挙げられます。これにより、主流のベンチマークでは扱われていない地域的な差別の源泉が存在するコンテキストにおいても、実用的に適用できる手法として機能する可能性があります。