arXiv (CV)AI
構造化された視覚的証拠分解を用いた閉塞性睡眠時無呼吸症候群の根拠に基づくマルチモーダルスクリーニング
Structured Visual Evidence Decomposition for Evidence-Grounded Multimodal Screening of Obstructive Sleep Apnea-Hypopnea Syndrome
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
閉塞性睡眠時無呼吸症候群(OSAHS)は、重篤な合併症を引き起こす可能性のある睡眠障害であり、確定診断には終夜睡眠ポリグラフ検査(PSG)が必要です。しかし、この検査は費用と時間がかかるため、事前スクリーニングの効率化が重要な課題となっています。従来のアプローチでは、汎用的なマルチモーダル基盤モデルに医学的判断を直接プロンプトすると、不安定で較正が悪い結果が得られることがありました。
そこで研究者らは「EviOSAHS」という根拠に基づくマルチモーダル推論フレームワークを提案しました。このシステムの特徴は、画像から得られる解剖学的証拠の取得と最終的な臨床判定を分離している点です。正面顔画像を7つの固定された解剖学的質問に分解し、首、あご、口、顔・首の脂肪、下顎、中顔面、鼻に関する情報を抽出します。これらの視覚的な回答は構造化された証拠カードに変換され、対象解剖学部位、可視性、リスク方向、証拠の強度、確実性、および簡潔な要約が記録されます。最終段階では、これらの証拠カードを整理された臨床プロフィールと組み合わせ、大規模言語モデル(LLM)がバランスの取れた二値分類スクリーニング判定を実行します。
研究グループは642名の被験者を対象にEviOSAHSを評価しました。正常者をスクリーニング陰性、軽度から重度のOSAHS患者をスクリーニング陽性に分類した結果、88.47%の精度、94.86%の感度、93.74%のF1スコア、5.14%の偽陰性率を達成しました。これは臨床情報のみを用いたプロンプティング、直接的なマルチモーダルプロンプティング、および単純な二段階パイプラインを上回る性能です。アブレーション実験により、7つの質問による視覚的分解とバランスの取れた最終判定が高感度の達成に不可欠であることが確認されました。
EviOSAHSは監査可能で高感度なPSG前スクリーニングワークフローを提供しますが、診断システムではなくトリアージアシスタントとして位置づけられています。臨床導入前には前向き検証、外部テスト、および較正されたオペレーティングポイント制御が必要とされています。