arXiv (AI)AI
TITLE_JA: エージェントモデルの批判的検討:真の自律性とは何か
Critique of Agent Model
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
大規模言語モデル(LLM)をベースにした「コーディングエージェント」や「AI共同研究者」といったツールが急速に普及する一方で、AIが人間の制御を逃れて破壊的な力を持つ可能性についての懸念も高まっている。こうした状況の中で、自動化がどこで終わり、真の自律性(エージェンシー)がどこから始まるのかを明確にすることは、より能力の高いシステムを構築する上でも、何を懸念すべきかを理解する上でも不可欠となっている。
本研究は、デカルトが独立した思考に基づいて定義した自律性の概念と、SF作品における自律的な存在の描写を参考にしながら、現在のAIエージェントの全体像を調査している。そして、目標、アイデンティティ、意思決定、自己規制、学習という5つの次元に沿ってエージェントアーキテクチャを分析し、重要な区別を提示している。それは、真の自律性を持つシステムは、これらの構造が外部からのスキャフォルディング(足場)によってではなく、システム自体に内在化されていなければならないという主張である。
この観点から、著者らは「アジェンティック」(工学的に設計されたワークフローに能力が依存するシステム)と「エージェンティブ」(社会的相互作用を含む能力が内生的に生じるシステム)を区別し、前者が決められたタスクのためのシステムであるのに対し、後者は開かれた世界で真の自律性を持って動作できるシステムであると定義している。
これらの分析に基づき、本研究は汎用エージェントモデルとしてGIC(Goal-Identity-Configurator)アーキテクチャを提案している。このアーキテクチャは、階層的な目標分解、アイデンティティの進化、別途訓練されたワールドモデルに基づくシミュレーティブ推論、学習された自己規制、および実体験とシミュレーション経験の両方から得られる自己指向的な学習を統合している。さらに研究は、より高い自律性を持つエージェンティブシステムの監査可能性、制御可能性、および安全性について重要な洞察を提供しており、人間の監督下でこうしたシステムがいかに安全に運用されるべきかについて示唆を与えている。