arXiv (CV)AI
TITLE_JA: 海洋プランクトン生態系を理解するための大規模マルチモーダルデータセット「Planktonzilla」と機械学習モデル
Planktonzilla: Multimodal dataset and models for understanding plankton ecosystems
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
海洋プランクトンは水中の食物連鎖の基礎を支え、地球規模のCO2固定化において重要な役割を担っています。そのため、信頼性の高い種の同定は海洋の健全性と気候フィードバックを理解する上で極めて重要です。しかし既存の分類モデルは、個別の観測データセットで学習されているため、異なる観測機器や環境での汎化性能が劣化するという課題がありました。
このような問題を解決するため、研究チームは「Planktonzilla-17M」という統合データセットを開発しました。このデータセットは13の異なる撮像システムから得られた公開プランクトン画像コレクションを統合したもので、標準化された分類体系と地理的・環境的メタデータを備えています。合計1,740万枚の画像を含み、そのうち374万枚がプランクトン画像で、602の分類学的クラス(そのうち201種は種レベルで同定)をカバーしており、現在までで最大かつ最も包括的なプランクトン画像データセットとなっています。
このデータセットを用いた実験では、教師ありモデルとCLIP様式の画像テキスト学習を同じViT バックボーン上で比較しました。その結果、分類学的系統樹をテキストとして使用した教師ありモデルはCLIP様式の学習と同等かそれ以上の性能を達成することが判明しました。また、BioCLIPやBioCLIP2といった既存の生物学的基盤モデルはプランクトン画像のゼロショット・少量ショット設定で性能が低いことが確認されました。Planktonzilla-17Mを用いることでプランクトン分類性能が大幅に向上し、海洋画像領域における現在の生物学的基盤モデルの限界が浮き彫りになりました。