arXiv (CV)AI
マルチスケール層注意機構を用いた甲骨文字認識の向上
Enhancing Oracle Bone Inscription Recognition via Multi-Scale Layer Attention
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
中国古代の文化を理解する上で重要な甲骨文字(OBI)の認識は、その複雑で不規則、かつ劣化した形状のため、正確な認識が極めて困難な課題となっています。従来は専門家の知識と手作業による分析に依存していたため、時間がかかり誤りも多く生じていました。深層学習は一般的な画像認識を大きく進歩させましたが、既存の手法では甲骨文字に固有の細粒度の詳細と微妙な変動を捉えることができず、認識性能は限定的です。
最近の層注意技術は、層間相互作用の強化を通じた細粒度依存性の捕捉を目指していますが、甲骨文字認識ではわずかな改善にとどまっています。研究チームはこうした制限を克服するため、マルチスケール層注意(MSLA)という革新的なパラダイムを提案しました。この手法は、マルチスケールと層間特徴相互作用の両者を明示的にモデル化します。複数の空間スケール全体にわたって細粒度の詳細で表現を豊かにすることで、より正確で堅牢な甲骨文字認識が実現されます。
大規模な甲骨文字データセットを用いた広範な実験により、MSLAは既存の注意機構を一貫して上回る性能を発揮し、かつ計算効率を維持することが実証されました。この研究は、深層学習と注意機構の組み合わせが、古文字認識という専門的で困難な領域にも有効に応用できることを示す重要な成果となります。