arXiv (NLP)AI
ペルシャ語の格言から物語を生成するLLMの意味解凍における制約条件付きタスク研究
Constrained Semantic Decompression in LLMs through Persian Proverb-Conditioned Story Generation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
密度の濃い抽象的な格言を魅力的で道徳的に忠実な物語に変換することは、深い文化的理解と堅牢な意味的根拠付けを必要とします。本研究は、このプロセスを「制約条件付き意味解凍」タスクとして定義し、ペルシャ語の格言に条件付けられた物語生成を大規模言語モデル(LLM)における抽象化から具体化への実現可能性を測るテストベッドとして位置づけています。
研究チームはペルシャ語を対象に、格言と人間による物語執筆、および明示的な意味をペアリングした「格言整合物語データセット(PAND)」を構築しました。このデータセットを用いて、人間による校正を組み込んだLLM判定と構造的メトリクスを組み合わせたハイブリッド評価フレームワークを開発し、複数のプロンプト体制にわたるモデルの振る舞いを分析しました。
分析結果から、現在のLLMには顕著な「解凍ギャップ」が存在することが明らかになりました。多くのモデルは表面的な流暢性では高いパフォーマンスを示す一方で、格言に内在する道徳的および因果的構造を忠実に具体化することに失敗しています。しかし、明示的な推論と反復的な洗練により、こうした失敗を部分的に緩和できることも示されました。これは、解凍エラーの多くが関連知識の完全な欠如というより、抽象的意味を物語形式に変換する際の困難さに起因していることを示唆しています。本研究で提案されたタスクは、他の文化的圧縮知識にも拡張可能です。