arXiv (NLP)AI
基盤なきペルソナ:LLM個体化問題における体制依存性
Persona Without Substrate: Regime-Dependence and the LLM Individuation Problem
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
大規模言語モデル(LLM)の内部表現に関する哲学的な議論が活発化する中、ペルソナベクトル研究の成果に基づいた個体化フレームワークに対する根本的な課題が提示されました。本研究は、BeckmannとButlinが提唱した存在論的フレームワークが、異なる体制(プロンプト調整、勾配降下によるファインチューニング、推論時ステアリング)において同じ方向が同じ内容を表すという暗黙の仮定を批判しています。
Qwen3-4B-InstructとMistral-7B-Instruct-v0.2を用いたペルソナトポロジー実験から、4つの重要な証拠が得られました。第一に、プロンプトから抽出されたベクトルとファインチューニング時の最適化盆が非共線性を示すこと。第二に、架空のペルソナが実在のアンカーよりも強く実在方向にモデルをシフトさせること。第三に、矛盾する価値評価を持つ混合物が学習履歴に決定された引力点に向かってバイアスを持つこと。第四に、推論時の算術演算とファインチューニング時のキメラ訓練において非対称的な合成代数が観察されることです。
これらの経験的証拠を踏まえて、著者らは「体制インデックス付き個体化」という新たな枠組みを提案しています。この考え方によれば、表現内容の同一性単位は単なる媒体ではなく、媒体と体制のペアであるべきとされます。このフレームワークの下では、先行研究で提唱された三つの候補位置は同じ対象に対して競い合うのではなく、それぞれ異なる体制内の異なるオブジェクトを記述しているものとして理解されます。これはMolloやMillière、Chalmers、Cerullo らの議論にも同様に適用される診断です。