arXiv (CV)AI
Yuvion VL:有害コンテンツとAI安全性に対応するマルチモーダル基盤モデル
Yuvion VL: A Multimodal Foundation Model for Adversarial Content and AI Safety
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
画像とテキストを同時に理解する汎用的な大規模言語モデルは、現実世界のリスクを確実に識別することが難しいという課題に直面しています。特にマルチモーダル対抗的コンテンツの特性により、有害な画像とテキストの組み合わせを見逃してしまう傾向があります。こうした課題に対応するため、研究チームはYuvion VLという新しいマルチモーダル大規模言語モデルファミリーを開発しました。このモデルは、コンテンツの安全性とAI安全性を目的として設計されており、指示調整版と推論指向版の両方を備えています。
Yuvion VLの特筆すべき特徴は、安全性を本質的に対抗的でマルチモーダルな問題として扱い、パイプライン全体を対抗的堅牢性を中心に設計している点です。データ構築段階では、対抗的認識を持つデータ合成と多段階品質管理を統合した自動パイプラインを開発し、ドメイン知識と推論アノテーションで強化された大規模で高品質なマルチモーダルサンプルを生成しています。
訓練には3段階のパイプラインを採用しています。まずリスク概念のクロスモーダル整列を目的とした継続事前学習、次に本番レベルの安全タスクを対象とする指示後学習、そして複雑なタスクにおける解釈可能性と性能向上のための推論後学習です。さらに「Confuse-then-Contrast Fine-Tuning」という対比学習フレームワークを導入し、モデル固有の混乱を抽出して多画像対比グループを構築することで、視覚的に類似していても安全性の意味が異なるケースを区別できるようにしています。
評価に向けて、Yuvion VL RiskEval(YVRE)というベンチマーク集を開発し、コンテンツとAI安全性、対抗的堅牢性、実世界の性能要件をカバーする多様な評価を実施しています。実験結果によると、Yuvion VL-32Bは業界トップレベルの安全性能を達成し、同規模のオープンソースモデルおよび最高クラスのクローズドソース商用モデルを上回るパフォーマンスを示しながら、同等の一般的能力を維持しています。