arXiv (AI)AI
TITLE_JA: NAVI-Orbital:軌道上での自律地球観測を実現するゼロショット視覚言語モデルの初実装
NAVI-Orbital: First In-Orbit Demonstration of a Zero-Shot Vision-Language Model for Autonomous Earth Observation
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
衛星からの地球観測データの生成速度がダウンリンク帯域幅を上回り続けるなか、衛星搭載データと地上での実用的な情報処理の間に大きなギャップが生じている。このギャップを解決するため、研究チームは低軌道(LEO)衛星に搭載されたソフトウェアシステム「NAVI-Orbital」を開発した。2026年4月16日、NAVI-Orbitalは視覚言語モデルによる自律マルチモーダル推論を完全に衛星上で実行する初の軌道上実装に成功したと報告されている。
本システムはGemma 3という軽量な視覚言語モデルを活用し、撮影されたシーンを分類し、その内容と特徴間の関係性をテキストで記述し、オペレーターからの自然言語による追加質問に応答することができる。従来のコマンド序列ではなく、平易な英語プロンプトによる再タスク化が可能であり、LangGraphというグラフベースの状態機械がシステムを統括し、検出と対話用の専用エージェントを調整している。
地上ベンチマーク(7,960画像から構成されるAIDベンチマークで88.16%の精度)、Flatsat検証、そして軌道上での新規取得の未処理地球画像キャプチャなど、複数の段階で性能が検証されている。特に注目すべきは、補正されていないYAM-9画像もハードウェアアクセラレーション付きGPU推論で衛星上処理され、ファインチューニングを必要としなかった点である。本成果は、衛星クラスのエッジコンピュータでファンデーションモデルを実行することの実行可能性を実証し、従来の「取得してからすべてをダウンリンク」という帯域幅プロファイルを、軌道上での地球観測の意味的圧縮により反転させることができることを示している。