arXiv (ML)AI
長距離単一ショット縞投影法における形状事前情報バイアスの診断と修復
Diagnosing and Repairing Shape-Prior Shortcuts in Long-Range Single-Shot Fringe Projection Profilometry
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
縞投影法(FPP)は三次元形状測定の重要な技術ですが、学習ベースのアプローチは主に近距離での応用に限定されてきました。本研究は、1メートルを超える長距離領域でのFPPの課題に取り組むものです。長距離計測では、距離の二乗則に従う光の減衰により縞信号の信号対雑音比が低下し、物理的な教師データの品質が劣化します。さらに、単一画像からは縞の次数情報が得られないため、この問題は本来的に不定立(ill-posed)です。既存の深層学習アーキテクチャもこのような条件下での動作機構が十分に解明されていません。
研究チームは機械的解釈可能性(MI)と適合的不確実性定量化(UQ)という二つの診断手法を用いて、この問題を診断・修復・検証しました。15,600枚の光学的にリアルな合成画像データセット(1.5~2.1メートルの距離に50個のオブジェクト配置)において、ベースラインのUNetは14.54ミリメートルの平均絶対誤差(MAE)を達成しました。しかし、線形プローブ分析、Grad-CAM、分布外テストの三つの調査手法が同じ結論に収束したことで、ネットワークが実は縞の位相情報をデコードするのではなく、オブジェクト境界の形状事前情報に依存して問題を解いていることが明らかになりました。
この形状バイアスを解決するため、研究チームはPhiCalNetというアーキテクチャを提案しました。このネットワークは深度値ではなく巻き込まれた位相を直接出力し、位相から深度への変換に固定の微分可能なキャリブレーション層を適用することで、形状事前情報の解法経路を損失関数のペナルティではなく、アーキテクチャレベルで除去しました。物理情報則を取り入れた損失関数の追加では効果が見られず、アーキテクチャの変更が主要因であることが確認されました。その結果、PhiCalNetはオブジェクトMAEを3.3倍削減して4.46ミリメートルまで改善しました。残存誤差は位相の±π不連続点の周辺の0.103%のピクセルに集中しています。適合的UQによる検証で、上位5%のピクセルを不確実性に基づいて除外すると、PhiCalNetのRMSEは64%削減(20.6から7.4ミリメートル)され、この診断の妥当性が確認されました。