arXiv (AI)AI
マルチエージェントシステムにおける効率的なエージェント間通信:アクション状態情報の最適化
What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
大規模言語モデル(LLM)を基盤とするマルチエージェントシステム(MAS)は、複数のAIエージェントが協調して複雑なタスクを解決する仕組みです。このようなシステムでは、エージェント同士が役割や処理パイプラインに従いながら順番に情報をやり取りしていきます。しかし従来は、エージェント間でやり取りされるメッセージの内容があまり制約されず、自然言語で自由に記述されていました。この自由形式の通信方式には大きな問題がありました。エージェント間で交わされるメッセージが増えるにつれてトークン使用量が急速に増加し、共有コンテキストウィンドウを圧迫し、最終的にはシステムの性能低下と推論コストの上昇につながるのです。
研究チームは5つの一般的なエージェント間通信戦略を2つのMASトポロジー環境で分析しました。その結果、すべての場合に最適な固定的な戦略は存在しないことが判明しました。しかし興味深いことに、実際に効果的なエージェント間メッセージには一つの共通点がありました。それは次のエージェントが処理を進めるために必要なアクション中心の情報を保持しているということです。この知見に基づいて、研究者らはPACT(Protocolized Action-state Communication and Transmission)という新しい通信プロトコルを提案しました。
PACTは、エージェント間通信を公開状態の更新問題として捉え、各エージェントの出力を共有履歴に追加する前に、コンパクトなアクション状態記録に変換します。異なるMASトポロジーにおいて、PACTは一貫して性能とコストのバランスを改善し、トークン数を大幅に削減しながら同等かそれ以上の性能を実現しました。さらに実際の開発環境でも効果を示し、OpenHandsではトークン削減率10%での解決率向上を、SWE-agentでは入力トークン数を半減させながら同等の解決性能を達成しています。