arXiv (AI)AI
有限エージェントの道徳的計算空間を定義する「有界道徳性」フレームワーク
Bounded Morality: Defining the Space of Moral Computation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
人工知能システムの倫理的な振る舞いをどのように実装するべきかは、AI開発における重要な課題です。従来、道徳的認知は義務論や結果主義、徳倫理学といった固定的な倫理理論に基づいて、静的なルールや価値関数として実装されてきました。しかし、新たな研究は、このアプローチに根本的な問題があると指摘しています。有限のリソースしか持たない人間やAIエージェントが、実際にどのような道徳的判断を下すことができるのかという観点が見落とされているということです。
この研究は「有界道徳性」という新しい形式的枠組みを提案しています。これはハーバート・サイモンの「有界合理性」概念を道徳領域に拡張したもので、道徳的状況を二つの直交次元で分析します。一つは「道徳的広がり」で、道徳的に関連がある対象物の範囲を指します。もう一つは「道徳的深さ」で、それらの相互作用を評価するために必要な推論統合のレベルを意味します。限られたリソースの下では、これら二つの次元の間に必然的なトレードオフが生じ、実行可能な道徳的計算の空間が定義されます。
この枠組みの中では、異なる倫理理論は道徳的真実をめぐる競争的な説ではなく、むしろ異なる条件下で局所的に効率的な戦略として理解されます。さらに、有界制約の下での「道徳的後悔」と「道徳的進歩」の形式的概念を導き出すことができます。この研究の示唆するところは、人工システムにおける道徳的アライメントは、人間の判断の直接的な模倣ではなく、道徳的推論能力の規模と配分に依存しているということです。この視点は、AIシステムの倫理設計に対して、より実践的で計算可能なアプローチをもたらす可能性を持っています。