arXiv (NLP)AI
電子商取引の詐欺的インターフェースにおけるウェブエージェントの安全性ベンチマーク
Benchmarking Web Agent Safety under E-commerce Deceptive Interfaces
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
自律型ウェブエージェントが現実世界のタスク実行に向けてますます展開されている中、その安全性の確保が重要な課題となっています。本研究は、電子商取引分野における現実的な詐欺的インターフェース下でのウェブエージェントの挙動を調査しています。研究チームは「WebDecept」という軽量で設定可能なプラグインフレームワークを開発し、既存のウェブ環境に詐欺的なインターフェースパターンを制御された方法で注入することを可能にしました。
WebDeceptを用いて、オープンウェブで一般的に観察される7種類の詐欺パターンを実装しました。これには、ターゲット広告、ドメインリダイレクト、ショッピング操作などが含まれます。タスク実行時にこれらのパターンをフロントエンドに注入することで、複数のマルチモーダルウェブエージェントを制御された環境下で評価しました。
その結果、現在のウェブエージェントは複数の詐欺的インターフェースパターンに対して非常に脆弱であることが判明し、プロンプトベースの制約だけではこうした失敗を軽減するには不十分であることが示されました。さらに、詐欺パターンの設計選択がこうした操作の成功にどのように影響するかを分析しています。これらの発見は、ウェブエージェントが現実世界への展開に向けてスケーリングされる際に対処すべき安全性課題を浮き彫りにしており、自律型エージェントの信頼性向上に向けた重要な研究成果となっています。