arXiv (Neural Computing)AI
TITLE_JA: 医療意思決定パイプラインのためのLLMガイド進化戦略
LLM-Guided Evolution for Medical Decision Pipelines
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
大規模言語モデル(LLM)を臨床ワークフローに適応させることは、一般的にコストのかかるファインチューニングや手動でのプロンプト・パイプラインエンジニアリングが必要とされてきました。しかし、新たな研究ではこの課題に対して、推論時間での進化アルゴリズムを活用した革新的なアプローチを提案しています。具体的には、LLMガイドMAP-Elites進化という手法を用いて、医療意思決定戦略を自動的に発見することに成功しました。
この研究では、緊急度トリアージ、対話的相談、医療画像分類という3つの臨床タスクを、タスク固有の適応度関数によって最適化される実行可能なアーティファクトに対する進化探索として定式化しています。緊急度トリアージでは、進化させたプログラムがSemigren精度を77.3%から87.1%に向上させ、緊急事態リコールを0.60から0.97に改善しました。さらに安全性重視のMIMIC-ESI性能も向上したとのことです。
対話的相談タスクでは、進化させたポリシーがLlama-3、Qwen-3.5、Gemma-4といった複数のモデルにおいて精度とコストのフロンティアを改善し、保留済みのiCRAFTMDへの転移も達成しました。肺炎画像分類(PneumoniaMNIST)では、プロンプトのみの進化がMedGemma VLMを改善しつつ、厳密なJSON出力を保持することができました。
注目すべきは、これらの改善がプロンプトの言い換え程度では説明できず、むしろプログラムレベルの機構、キャリブレーションされたトリアージ境界、標的化された証拠収集、選択的コミットメント、発見指向の視覚的意思決定ルールといった解釈可能で本質的なメカニズムから生じていることです。この成果は、医療AIの実装においてコスト効率的で説明可能な最適化手法として大きな可能性を示しています。