arXiv (Neural Computing)AI
ビジョン言語モデルの美学に進化させる——生成デザインにおける審美性評価の新手法
Evolving to the Aesthetics of a Vision-Language Model
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
進化的アルゴリズムは創造的領域で著しい成果を上げており、生成的タイポグラフィやデザイン、音楽生成など様々な応用が進んでいます。しかし、抽象的な出力の望ましい美学を効果的に捉えるフィットネス関数の設計は依然として解決すべき課題でした。本研究では、ビジョン言語モデル(VLM)を用いて、生成デザインの個体群の審美性を評価する2つの手法を探索しています。
第一の手法はCLIP-IQAを使用して、各デザインに対して審美スコアを予測するアプローチです。これに対し第二の手法は、候補同士を対戦させ、ユーザーが指定したカスタムプロンプトを用いてVLMが勝者を決定するという対戦方式を採用しています。これらの対戦結果はGlickoレーティングシステムを通じて個体群のランキングを推定するために活用されます。
研究チームはカスタム生成システムを用いたケーススタディの文脈でこれらの手法を提示し、得られたランキングをアーティストの美的ランキングおよび他の審美評価技術による結果と比較しています。さらに、これらのアプローチを使用してデザインを進化させるプロセスにおけるアーティストの体験を記録し、両手法の強みと弱みについて批判的に分析しています。