arXiv (NLP)AI
科学概念の計算的概念史:初期デジタル手法からLLMまで
Computational conceptual history of scientific concepts: From early digital methods to LLMs
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
本論文は、大規模言語モデル(LLM)を科学史・科学哲学・科学社会学(HPSS)における概念分析の計算的アプローチの長い歴史の中に位置づけるものである。研究者たちは、LLMが既存の手法にもたらす新しい価値、継承する根本的な課題、そして最近のケーススタディを包括的に検証している。
前半では、LLM以前の計算的概念史を再構築している。具体的には、科学史における初期のデジタル手法、デジタル歴史学からの分布的アプローチ、そして語彙的意味変化検出という3つの研究の流れを統合している。コーパス構築、操作化とモデリングの選択、そして評価と解釈という主要な課題と機会に焦点を当てながら、方法論的な概要を提供している。
後半では、LLMの時代へと転換し、LLMの簡潔な紹介に始まり、語彙的意味変化検出に関するLLMベースの研究とHPSSの関連ケーススタディをレビューしている。その後、初期の方法論的問題を再考し、コーパス構築、モデル選択と訓練データ、操作化のトレードオフ、評価と解釈の問題がLLMベースのワークフローの中でどのように機能するかを示している。この研究は、計算手法の進化が如何に概念分析の精密性と複雑性を深化させるかを明らかにしている。