arXiv (ML)AI
勾配ブースティングと分布無関予測を用いた非アルコール性脂肪肝疾患のリスク予測
Conformal Risk Prediction for Non-Alcoholic Fatty Liver Disease Using Gradient Boosting with Distribution-Free Coverages
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
非アルコール性脂肪肝疾患(NAFLD)は世界中の成人の約25%に影響を及ぼし、肝臓および心血管系に重大なリスクをもたらしている。現在のところ、集団レベルのスクリーニングツールは十分ではなく、より精密で信頼性の高い予測方法が求められている。今回、研究者らは勾配ブースティング決定木と適合的予測(コンフォーマル予測)を組み合わせた機械学習フレームワークを開発した。このアプローチは、個別のリスク推定に対して較正された分布無関のカバレッジ保証をもたらすもので、相互情報量に基づく安定性選択手順を統合して、臨床的に解釈可能で限定的な特徴部分集合を特定している。
研究チームは中国広州の複数医療機関からの患者コホートでこのフレームワークを評価した。プライマリデータセットは2,187名、外部検証データセットは412名で、人口統計学的特性、代謝バイオマーカー、生活習慣因子を含む78個の候補特徴を用いた分析を実施している。その結果、内部検証でAUROCが0.912、外部検証で0.891を達成し、ディープニューラルネットワーク、TabNet、サポートベクターマシン、ロジスティック回帰といった従来手法を上回る性能を示した。
適合的予測セットは90%の名目レベルで91.3%の実証的カバレッジを達成している。これらのスコアから導出された3段階のリスク層別化は、患者集団を異なるグループに分離し、高リスク群は低リスク群と比較して12ヶ月の進行率が4.7倍に達することが明らかになった。選択された特徴量(特に腰囲、ALT、GGT、トリグリセリド、空腹時血糖、BMI)は確立された代謝リスク因子と一致しており、生物学的妥当性を有している。