arXiv (NLP)AI
大規模言語モデルを用いたアラビア語テキストの自動採点:文献レビュー
Automated Scoring of Arabic Text Using Large Language Models: A Literature Review
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
現代の教育システムにおいて、自動テキスト採点(ATS)は人間の介入なしに学習者の回答を一貫性を保ちながら大規模に評価できるため、極めて重要な役割を果たしています。近年、大規模言語モデル(LLM)へのアクセスが容易になり、アラビア語固有のデータセットが増加したことで、この分野への関心が再び高まっています。
本研究は、アラビア語テキストの自動評価におけるLLMベースのアプローチを調査し、短答問題採点(ASAG)とエッセイ採点(AES)の両方に焦点を当てています。研究では、適用領域、フィードバック生成機能、採用されたLLMアーキテクチャ、能力参照枠組みとの適合性、プロンプトエンジニアリング戦略という5つの次元から構成された体系的な分類法が新たに提示されました。
この分類法を適用することで、研究者らは既存の研究を比較分析し、それらの方法論的アプローチ、使用されたデータセット、評価指標、および報告されたパフォーマンスを検証しています。分析の結果は、アラビア語話者コミュニティ全体の教育の質向上において大きな意義を持つため、アラビア語ATSに関する継続的で教育学的に根拠のある研究の必要性が強調されています。