arXiv (AI)AI
TITLE_JA: コンセンサスは戦略的に不十分:推論過程の不一致を知識表現シグナルとして活用する
Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
マルチエージェントシステムの設計では、投票やコンセンサスプロトコル、議論、耐障害性集約といった手法を通じて、エージェント間の不一致を減らすことが一般的な目標とされてきました。しかし、この研究が主張するのは、そうした目標だけでは不十分だということです。特に価値判断が必要となるタスク領域では、エージェント間の不一致は単なるエラーではなく、真正な規範的不確実性を反映している可能性があるからです。
本研究は人間とAIの協調的なモデレーションにおける推論過程の不一致に関する先行研究を基盤として、推論トレースとエージェントの決定を記号的な不一致状態に抽象化する知識表現層を提案しています。明示的な推論トレースとバイナリ決定を出力するエージェントが与えられた場合、推論の類似性と結論の合意度に応じて四つの状態を区別します。具体的には、「収束的合意」「発散的合意」「収束的不一致」「発散的不一致」の四つです。これらの状態は棄却可能な戦略的ルーティング規則を支援します。
このフレームワークはコンテンツモデレーション領域で具体化されており、不一致を考慮したルーティングがLLMの下位象徴的な思考と記号的知識表現の間に橋渡しを提供することを論じています。これにより、マルチエージェントシステムが単純な合意を求めるのではなく、異なる観点や不確実性を戦略的に活用する能力を備えることができるようになります。