arXiv (NLP)AI
TITLE_JA: マルチモーダル言語モデルを用いたソーシャルメディア上のAI生成コンテンツ検出
Detecting AI-Generated Content on Social Media with Multi-modal Language Models
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
生成AIの急速な発展により、フォトリアリスティックな画像や動画がソーシャルメディア上で大量に配信されるようになりました。これらのコンテンツはスパム、偽情報、操作、詐欺などの悪用されるケースが増加しており、重大な問題となっています。既存のAI生成コンテンツ(AIGC)検出手法は、新しい生成モデルへの汎化性能の低さ、単一モダリティへの依存、そして解釈可能な説明の欠如など、複数の課題に直面していました。
今回発表された研究は、これらの課題を解決するための包括的なパイプラインを提示しています。研究チームは、複数のソーシャルメディアプラットフォームから多様なマルチモーダルデータを継続的に収集し、検出と説明を同時に行うコンパクトなビジョン言語モデルの訓練を実施しました。このアプローチにより、公開ベンチマークにおいて最先端の検出性能を達成し、複数のプラットフォームの内部ソーシャルメディアデータセット上でも堅牢な検出・説明能力を実証しました。
実際の運用では、このモデルをソーシャルメディアプラットフォームの投稿推奨機能に導入したところ、ユーザーエンゲージメントに対してポジティブな下流効果が観察されました。本研究は、動的で複雑な実世界のソーシャルメディア環境において、効果的なAIGC検出を実行することが実現可能であることを示す重要な成果となっています。