arXiv (Robotics)AI
メカトロニクスシステムのパラメータ同定における最適実験設計のための強化学習
Reinforcement Learning for Optimal Experiment Design in Parameter Identification of Mechatronic Systems
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
メカトロニクスシステムの正確なシステム同定には、信報性の高い励起信号が不可欠である。しかし従来のシステム同定アプローチでは、ハードウェアの安全制約を満たすために専門家の知識と手作りの信号設計が必要であり、汎用性に制限がある。本研究では、強化学習エージェントを用いて、Quanser Aero 2テストベッド上で最適な励起信号を学習し、報酬形成を通じて安全制約を自律的に実装する手法を提案している。
10回の独立した学習実験を通じて評価されたこのエージェントは、同定された3つのパラメータすべてにわたって競争力のある推定精度を達成している。古典的ベースラインを上回る性能を発揮する一方で、安全違反は0.75%にとどまっており、実用的な安全性も確保されている。
本研究の意義は、従来は専門家による手動設計が必要だった励起信号の設計プロセスを、機械学習により自動化できることにある。強化学習を活用することで、システムは試行錯誤を通じて最適な信号パターンを学習しながら、安全制約を同時に満たすという複雑な要件に対応できるようになる。これにより、メカトロニクスシステムの同定がより効率的で汎用的なものになる可能性を示しており、産業応用への道を開くものである。