arXiv (ML)AI
TITLE_JA: 化学反応ネットワークにおける強化学習の実装:走化性を好奇心駆動探索として応用
Implementation of reinforcement learning in chemical reaction networks: application to phototaxis as curiosity-driven exploration
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
単細胞生物が環境をナビゲートする際のメカニズムを理解することは、生物学的知能の本質に迫る重要な課題です。本研究は、藍藻類クラミドモナスの走光性(光に向かう性質)を、従来の単純な刺激応答プロセスではなく、情報駆動型の知覚運動プロセスとして再解釈する革新的なフレームワークを提案しています。
研究チームは、部分観測マルコフ決定過程(POMDP)と化学反応ダイナミクスを組み合わせた統合モデルを構築しました。このモデルでは、環境変数は隠れた状態として扱われ、細胞は各観測から得られる情報を通じて、ベイズ的なステップで最小限の内部状態を更新します。細胞内の生化学的ネットワークは、光への指向と探索的な方向転換のバランスを取り、化学反応ネットワーク常微分方程式(CRN-ODE)を通じて実装可能な形式で実現されます。
研究では、30個の実験的に記録されたクラミドモナスの軌跡に対して逆強化学習(IRL)を適用し、観測された走光性運動と一致する行動目的を推論しました。その結果、モデルは光への配向分布を実験データと同等の精度で再現することに成功しています。さらに興味深いことに、このフレームワーク内では、走化性の特徴である「走行と回転の交互現象」が、実は情報獲得戦略として機能していることが明らかになりました。細胞が回転することで、新しい感覚配置をサンプリングし、センサーの曖昧性を解決しているのです。本研究は、細胞レベルの生化学的ネットワークがいかに適応的で知的な行動を支援するかを実証しており、最小限の認知能力から適応的行動がいかに生じるかを理解するための重要な一歩となります。