arXiv (AI)AI
PrologMCP:LLMエージェント向けの標準化されたProlog統合ツール
PrologMCP: A Standardized Prolog Tool Interface for LLM Agents
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
最先端の推論特化型言語モデルであっても、深い階層の演繹的タスクでは依然として失敗することが知られています。性能を内部推論の拡張によって改善しようとすると、計算コストが急速に増加してしまいます。こうした課題に対して、新たなアプローチが注目されています。それが記号的委譲(シンボリック・デレゲーション)です。言語モデルが問題を形式化し、専門の推論エンジンが推論を実行するという分業の仕組みです。
しかし現状では、論理プログラミングの自動形式化パイプラインは特定のタスクやエージェントに組み込まれた、場当たり的な統合ばかりです。今回発表されたPrologMCPは、このような課題を解決するものです。Model Context Protocol(MCP)を通じてPrologを状態保持ツールとして標準化された形で提供するオープンソースサーバーで、様々なタスクに対応できるよう設計されました。コンパクトなツールインターフェース、構造化されたエラーレポート、セッションごとの独立性により、問題の翻訳・実行・検査・修復のループを再利用可能なプリミティブとして実現します。
PrologMCPの有効性を検証するため、複数の最新LLM(Claude Sonnet 4.6、GPT-4.1、o4-mini)とPrologMCP対応のフォーマライザーエージェントを比較実験しました。汎用的なベンチマーク(PARARULE-Plus)では、フォーマライザーは推論特化型LLMと同等かそれ以上の精度(1.00対1.00/0.998)を達成し、標準モデルとの差は顕著でした。より難度の高いテストセットでは、フォーマライザーがほぼ完全な精度(1.00/0.99)を保つ一方、推論LLMは0.95/0.94に低下しています。これらの結果から、Prolog推論をMCP経由で委譲することが、自然言語による長い推論チェーンに代わる堅牢で検査可能な代替手段となることが示唆されました。