arXiv (NLP)AI
多言語大規模言語モデルにおける比喩表現生成の言語横断的操作
Cross-Lingual Steering for Figurative Language Generation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
多言語対応の大規模言語モデル(LLM)は比喩表現を生成できますが、その背景にある内部信号が言語固有のものなのか、言語間で再利用可能なのかは明らかではありませんでした。本研究は、アクティベーション・ステアリング(活性化操作)という技術を用いて、この疑問に取り組んでいます。
研究チームは、ある言語における比喩的表現とリテラル(字義通りの)表現の活性化パターンの違いから、比喩のカテゴリに対応する方向性を推定しました。その後、この方向性を別の言語での生成時に適用しました。5つの比喩カテゴリ、6つの言語、4つの異なる多言語LLMにわたる実験を行った結果、これらの方向性は自言語内では確実に機能し、特にメタファー(隠喩)とシミル(直喩)において最も堅牢な効果を示しました。
より重要な発見は、この方向性が言語間で転移することです。ある言語で学習した方向性を別の言語に適用すると、目標言語での比喩的振る舞いが増加しました。特にドイツ語がこうした転移に最も応答性を示しました。さらに興味深いことに、複数の言語から組み立てられた方向性は、目標言語自体のネイティブな方向性と同等か、それ以上の効果を達成できることが明らかになりました。この共有される成分を除去すると、ネイティブなステアリング能力が低下することから、言語間で共有されながらも目標言語に依存した比喩生成の信号が存在することが直接的に証明されました。