arXiv (Multi-Agent)AI
TITLE_JA: ソフトウェアログから状態機械を用いて多関係型合成データを生成し、異常検知を向上させる手法
State Machine Guided Multi-Relational Synthetic Data from Logs for Anomaly Detection
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
ソフトウェアシステムが生成する膨大なログデータは、システムの実行動作、障害、コンポーネント間のやり取りを記録していますが、既存の異常検知手法の多くはこれらのログを単なる一連のテンプレート配列として扱っており、イベントがどのように共存し時間とともに進化するかを支配する関係的な実行構造を見落としています。この研究は、ログから直接実行状態機械を復元し、トレース、イベント、状態、遷移、パラメータを結合する対応する多テーブル関係スキーマを誘導することで、この隠れた構造を発見するフレームワークを提案しています。
発見された状態機械は、構造的、時間的、プロセス的な制約を保持しながら稀だが有効な実行動作を増幅する、現実的な多関係型合成データを生成するための生成事前分布として機能します。研究者らは制約検証、分布類似性、プロセスレベルメトリクスを通じて生成データの忠実性を評価し、実ログに合成関係データを追加することで、シーケンスベースのベースラインやナイーブなオーバーサンプリングと比較して、保留されたテスト用の実データセット上での異常検知とバグ検知が大幅に向上することを実証しています。
この研究の成果は、実行ログが潜在的な状態機械に支配されるリレーショナルデータベースを暗黙的に符号化しており、この構造を復元することで堅牢で解釈可能な異常検知のための原理的な合成データ生成が可能になることを示しています。ソフトウェア開発やシステム監視の領域において、より精密な異常検知や信頼性の高いバグ検出への道を開く重要な方法論となる可能性があります。