arXiv (CV)AI
サッカー放映映像から選手ごとのボールアクションを検出する新手法:注意機構とアンサンブル学習の活用
SoccerNet 2026 Player-Centric Ball Action Spotting: Per-Player Attention with Agreement-Based Ensembling
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
スポーツ分析におけるコンピュータビジョン技術の進化は目覚ましく、サッカーの試合映像から選手の細かなアクションを自動検出する取り組みが活発化しています。本研究はSoccerNet 2026チャレンジに向けて提案された、選手ごとのボールアクション検出システムです。このシステムは放映映像から各選手がいつどのようなボールアクション(シュート、パス、ドリブルなど)を行ったかを自動的に識別することを目的としています。
提案手法は二段階のパイプラインで構成されています。第一段階では「Track-Aware Action Detector(TAAD)」が映像フレームから各選手のアクションログを生成します。ここでは時間軸方向のコンテキストを捉えるために、フレーム間の関連性を学習するtemporal transformerが導入されています。第二段階では「Denoising Sequence Transduction(DST)」というtransformerが、ゲーム状態の特徴とTAADから得たログを構造化されたイベントシーケンスに変換します。
DST段階における重要な改善点として、ゲーム状態特徴に対する二段階の選手ごと注意機構が導入されました。特に、複数選手間の関係性を先に学習してから時間軸方向の依存関係を学習する「空間優先の注意順序」を採用することで、検証データにおけるMacro-F1スコアを1.87ポイント向上させました。
最後に、4つの異なるモデル変異体を訓練し、それらを「Weighted Event Fusion」アンサンブルで統合することで、単一モデルの誤検出を抑制しながら検出漏れを最小化しています。特にタックルのような稀なクラスに対しては専用の例外処理を施しています。この結果、チャレンジのベースラインとなるMacro-F1スコアを48.6から58.94へと大幅に改善することに成功しました。