arXiv (NLP)AI
SproutRAG:注意機構ガイド型ツリー検索と段階的埋め込みによる長文書RAG
SproutRAG: Attention-Guided Tree Search with Progressive Embeddings for Long-Document RAG
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
検索拡張生成(RAG)システムは、取得する情報の粒度と文脈的一貫性のバランスを取ることが課題となっています。従来の手法では、LLMガイド型のチャンキング、単一レベルの文脈拡張、または階層的要約などを通じてこの問題に対処してきました。しかし、これらのアプローチはインデックス作成や取得時に高コストなLLM呼び出しに依存したり、文脈集約を単一の粒度レベルに限定したり、要約によって情報損失を招いたりという問題を抱えていました。
新たに提案されたSproutRAGは、注意機構ガイド型の階層的RAGフレームワークで、この課題に対して異なるアプローチを取ります。文レベルのチャンクを、学習されたセンテンス間の注意機構を用いて二分木構造に組織化し、段階的により大きいながらも意味的に一貫性のある単位へと階層化するのです。外部LLMへの依存や固定的な文脈拡張、損失を伴う要約に頼らず、SproutRAGは文書構造の意味を最もよく捉える注意ヘッドとレイヤーを学習することで、追加のLLM呼び出しや圧縮された要約なしに複数粒度での取得を実現します。
取得時には、SproutRAGは階層的ビームサーチを用いて複数の粒度で候補を取得し、フラットな取得では捉えられない複数文にわたる関連性をキャプチャします。このフレームワークは埋め込みと木構造の両方を改善する統合目的関数により、エンドツーエンドで学習されます。科学論文、法律文書、オープンドメインなど4つのベンチマークにおける実験結果は、SproutRAGが最強ベースラインと比較して平均6.1%の情報効率の向上を達成したことを示しています。