arXiv (ML)AI
医薬品安全性監視における因果推論モデル選択の重要性:InferBERTフレームワーク内の分類モデル比較分析
The Critical Role of Model Selection in Causal Inference: A Comparative Analysis of Classification Models within the InferBERT Framework for Pharmacovigilance
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
医薬品の有害事象(ADE)と偽の相関を区別することは、医薬品安全性監視(ファーマコビジランス)における中核的な課題である。InferBERTフレームワークはトランスフォーマーモデルとDo-calculusを組み合わせた先進的なアプローチだが、その成功は基礎となる分類モデルの選択に大きく依存している。本研究では、InferBERT内でのモデル選択の影響を評価し、より単純なモデルで十分か、ドメイン特化型の事前学習が有効か、大規模言語モデル(LLM)への拡張が因果検出を改善するか、そして事後キャリブレーションの効果を検証した。
研究では、鎮痛薬誘発性急性肝不全(AILF)とトラマドール関連死亡(TRAM)の2つのベンチマークデータセットを用いて4つのモデルを比較した。XGBoost(ベースライン)、ALBERT(元のInferBERT)、BioBERT(バイオメディカル特化トランスフォーマー)、Med-LLaMA(医療用LLM)について、20回繰り返された5分割交差検証で評価を実施している。精度、較正前後のExpected Calibration Error(ECE)、PRR、ROR、EBGMとの因果用語のJaccard一致度を測定し、ペアt検定で有意性を検証した。
結果として、BioBERTが両データセットで最高の精度を達成し、Med-LLaMAはそのサイズとパラメータ効率的ファインチューニングにもかかわらずパフォーマンスが低下した。ドメイン特化型の事前学習が決定的な役割を果たし、キャリブレーションはECEを改善したものの、精度と因果検出には混在した影響を与えた。BioBERTは従来のファーマコビジランス信号との最強の一致性も示している。これらの結果から、ドメイン特化型の事前学習は単純なベースラインより明らかに有利であり、単にモデルサイズを拡大するより、管理可能でドメイン認識的なモデルに投資することが、計算ファーマコビジランスにより有効であることが示唆されている。