arXiv (AI)AI
マルチエージェント型LLM協議における隠れたアンカーの役割
Hidden Anchors in Multi-Agent LLM Deliberation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
複数のAIエージェントが複数ラウンドにわたって回答を交換・修正するマルチエージェント型LLM協議は、推論精度の向上手段として急速に普及しているにもかかわらず、その仕組みや有効性について理論的なモデル化はほとんど進んでいない。このアプローチは、人間が決定に至るプロセスを反映しており、社会的動物である人間が集団の影響(古典的な意見動学モデルであるDeGrootやFriedkin-Johnsenが捉える「群れ効果」)と個人の内部信念の両者に引っ張られることを模倣している。
今回の研究は、マルチエージェント協議を閉ループ動的システムとしてモデル化している。各エージェントは「アンカー」と呼ばれる隠れた内部信念を持ち、この信念が周囲のエージェントの意見に関わらず継続的にエージェント自身の意見を引き寄せるという仕組みだ。この研究により、このアンカーは協議プロセスだけから復元可能であることが示された。さらに注目すべき点として、古典的なコンセンサスルールでは禁止される挙動、すなわちあるエージェントの正解への信頼度が初期段階のどのエージェントの値よりも高く上昇し、初期信念によって形成される凸包の空間を超え出る現象が説明できることが明らかになった。
研究チームは、復元されたアンカーが保持されたテストラン(未見データ)も予測するかどうかを検証することで、モデルが真にアンカーに駆動されているかを判定する簡潔なテストを提案している。3つのオープンウェイトモデルファミリー全体にわたる検証では、このメカニズムは全か無かではなく、スペクトラムとして存在することが確認された。すべてのアンカーの影響力はほぼ同等の強さを持つものの、アンカーが位置する場所が異なり、初期意見から遠く離れた場所にアンカーが存在する場合にのみ協議が凸包から逃れ、完全な閉ループモデルが必要となることが示唆された。