arXiv (CV)AI
TITLE_JA: マルチモーダル大規模言語モデルを微調整して、自宅動画から臨床医レベルの自閉症行動評価を実現
Fine-tuning a multimodal large language model for clinician-grade autism behavioral scoring from short home videos
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
自閉症スペクトラム障害(ASD)はアメリカの子どもの31人に1人に影響を及ぼしており、診断の中央年齢は4年を超えています。自宅動画などの入手しやすい観察データを活用して定量化された診断を提供するAIパイプラインは、より早期の診断と早期治療の適切な実施につながる可能性を持っています。この研究では、Gemini 2.5 Proを400本の臨床医評価済みの自宅動画を使用してロー・ランク適応により微調整し、様々な機械学習モデルに転用される際に信頼性のある予測を生成することが実証されている30の行動特性のみで訓練しました。
保留された99人の子ども(自閉症49人、定型発達児50人)に対する評価では、臨床医との一致度(特性ごとの加重コーエンのカッパ値)が40%改善され(p<0.001)、評価可能な28の特性のうち27が改善されました。さらに予期しない能力として、直接的なASD診断のF1スコアは53%改善し(p<0.001)、臨床医の成果と同等またはそれを上回りました。微調整されたLLM由来の行動特性を利用した分類器支援パイプラインは、すべてのテスト経路にわたって臨床医スコアと一致し、77%の精度(95%信頼区間:68-85%)とAUC 86%(95%信頼区間:78-92%)を達成しています。この研究成果により、微調整されたマルチモーダル大規模言語モデルは、自閉症の評価と診断における拡張可能な行動特性抽出器として機能することが実証されました。