arXiv (AI)AI
TITLE_JA: ファウンデーションモデルエージェントにおけるデプロイ時のメモリ化:個人化とプライバシーのトレードオフ
Deployment-Time Memorization in Foundation-Model Agents
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
ファウンデーションモデルを基盤とするエージェントは、ユーザーとの相互作用をまたいで情報を記憶する長期的なシステムとなっており、メモリ化がモデルの重みだけでなく、デプロイ時の重要な機能として機能するようになっています。本研究は、このデプロイ時のメモリ化を体系的に分析し、エージェントのメモリ設計がいかに個人化の有用性、抽出リスク、削除忠実度に影響を与えるかを調査しています。
研究チームは、エージェントのメモリを「プライバシー・ユーティリティ・フロンティア」として定式化し、個人化リコール(PR)と敵対的抽出率(AER)の2つの指標で評価しました。さらに、要約の積極性、検索幅(k値)、削除モードという3つのメモリ設計要素を変化させながら検証しています。加えて、削除されたはずの情報が派生メモリ層から回復可能かどうかを定量化する「忘却残差スコア(FRS)」も導入しました。
LongMemEvalデータセットでの実験では、主要事実の要約がGemma 3 12Bで76%、GPT-4o-miniで64%のキャナリー抽出を削減し、個人化リコールはほぼ維持されることが確認されました。重要なのは、内容が圧縮されると、k値を増やしても情報漏洩が復元されないということです。しかし、この圧縮手法は削除忠実度の問題をもたらします。生データのみの削除では、派生された要約コピーが約20%の事例で回復可能であり、完全なパイプライン削除またはトゥームストーン処理によってのみ、最悪層の残差をゼロに駆動できるのです。
これらの結果は、永続的なエージェントメモリがメモリ化メカニズムとして一級の評価対象であることを確立しています。エージェントが何を想起できるか、何が抽出可能になるか、何を真に消去できるかを総合的に評価する必要があるということです。