arXiv (AI)AI
マルチモデルAIシステムにおける創発的協調的熟慮:ビザンチン障害耐性由来の認識論的統合プロトコル
Emergent Collaborative Deliberation in Multi-Model AI Systems: A BFT-Derived Protocol for Epistemic Synthesis
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
複数のAIモデルを協調させて、より堅牢で偏りの少ない推論を実現する新しいプロトコルが発表されました。「Consilium Protocol」と名付けられたこのアーキテクチャは、ビザンチン障害耐性(BFT)の概念に基づいており、モデル間の意見の不一致をエラーではなく認識論的なシグナルとして扱うという革新的なアプローチを採用しています。
研究チームは、言語モデルに対して意図的に異なる「認知ペルソナ」を割り当てることで、モデル自体の特性と推論方法を分離しました。さらに、量的ファイナンスから適応させた「In-Sample/Out-of-Sample検証フレームワーク」を導入し、訓練データに基づく合意と経験的に根拠のある結論を区別しています。10のドメインカテゴリーにわたる32のトピックで1,478回の熟慮セッションを実施した結果、複数の重要な発見が得られました。
最も注目すべき結論は、基盤となるモデルではなく、割り当てられた認知ペルソナこそが認識論的な振る舞いを決定するということです。バッチあたり0.0002ドルという低コストの推論モデルが、10.69ドルもかかるフロンティアモデルと同等の分析出力を生み出しました。また、RLHF(Reinforcement Learning from Human Feedback)アライメント訓練は測定可能で領域固有の認識論的盲点を生み出すことが判明しました。特に政策論争のあるトピックでは、確立された科学分野よりも敵対的な異議が12.3ポイント少なく、AI安全性に関するトピックでは著しい非対称バイアス(11.6%)が存在し、AIが危険であるという主張に対してはより強く異議を唱えるものの、AIリスクが過大評価されているという主張に対してはそうではないことが明らかになりました。
プロトコル自体には方向性バイアスがなく、移民問題で2.3%、再生可能エネルギーで1.2%の差異に留まっています。アウト・オブ・サンプル証拠検索は239の主張を100%の証拠検索率で検証し、訓練データに基づく熟慮では見えなかった167個の盲点を発見しました。全体的な計算コストはわずか217ドルであり、プロトコル仕様はMITライセンスの下で公開され、独立した検証を可能にしています。