arXiv (AI)AI
Agent4cs:大規模階層型コードベース向けマルチエージェント要約システム
Agent4cs: A Multi-agent System for Code Summarization in Large Hierarchical Codebases
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
大規模で複雑なコードベース、特に難読化された構造と不完全なドキュメンテーションを持つプロジェクトの理解は、ソフトウェア開発における重大な課題となっています。既存のコード要約ソリューションはClaudeなどの単一の言語モデルに依存し、ソースコードをフラットなテキストとして扱うため、リポジトリ内に存在する豊富な相互依存関係と階層情報を十分に活用できていません。このような問題に対処するため、研究チームはAgent4csというマルチエージェントフレームワークを提案しました。
Agent4csは、ボトムアップ方式でコードベース全体を要約する革新的なアプローチを採用しています。このシステムは複数の専門化されたエージェントで構成されており、要約エージェントが堅牢で正確な要約を生成し、キーワード抽出エージェントがサブフォルダから重要な情報を積極的に特定します。さらに品質保証エージェントが出力を反復的に改善し、可読性、一貫性、完全性を向上させます。これらのエージェントが協調して働くことで、コードベースの複雑な構造をより効果的に処理できます。
7つの最先端言語モデルでの評価結果から、Agent4csは既存の構造化プロンプト手法と比較して、すべてのフォルダレベルにおけるセマンティック一貫性を平均8%改善し、実世界のデータセットでは正規化キーワードカバレッジ率で最大38%の向上を達成しました。このフレームワークは、大規模で複雑なプロジェクトのコード理解と保守性を大幅に向上させる可能性を示しています。