Stable Diffusionにおけるプロンプトとネガティブ・プロンプトの反応の違い

要約：画像生成AIツールのStable Diffusionで、作風を示す文言を入力したところ、プロンプトとネガティブ・プロンプトとでは、非常に対照的な反応が見られた。

1 ネガティブ・プロンプトに作風を入力しただけでは、あらゆる点で異なるような画像が生成される
2 プロンプトに同時代の肖像画のスタイルも入力
3 似通った画像の生成は、時代の性質の忠実な再現の結果

ネガティブ・プロンプトに作風を入力しただけでは、あらゆる点で異なるような画像が生成される

これまで画像生成AIツールのStable Diffusionを使用して、レオナルド・ダ・ヴィンチの肖像画の作風を真似るのではなく、むしろその対極にあるような作品作りを試みてきた。
そしてその結果、斬新なファッションを身に纏った女性のポートレイト写真や、人体のプロポーションが崩れた女性のイラストレーションなどが生み出された。

ただ、これらの作品は確かにダ・ヴィンチが絶対に制作しないようなものばかりであるが、作風以前に当時は物理的に制作不可能なメディアでもあることから、これではダ・ヴィンチの作風と異なる作品が生成されるのも当然であろう。

プロンプトに同時代の肖像画のスタイルも入力

そこでダ・ヴィンチの作風との違いがより明確になるように、彼が生きていた時代の肖像画を示す「Renaissance portrait」をプロンプトに入力し、ネガティブ・プロンプトには「Leonardo da Vinci portrait style」と入力した。
こうして生成されたのが次の画像である。

似通った画像の生成は、時代の性質の忠実な再現の結果

上述の画像を見て感じるのは、1、4、5枚目などは、同じ作家が描いたと思えるほど作風が似通っていることである。
しかも作風のみならず、モデルになっている女性の服装や髪型、さらには顔の特徴までもが類似している。

絵柄がランダムに生成される設定にしてあるにもかかわらず、これだけ似た画像が生成されるということは、少なくても「ルネサンス風の肖像画」というワードには、典型的な描画のパターンが存在するのではないかと考えられる。

しかしこれも当時、肖像画の被写体となるのは主に上流階級の人々であり、さらには今ほどファッションが多様化していないことを考えると、画像生成AIのこの挙動は、むしろ時代の性質を忠実に再現していると言えるのかもしれない。

最新情報をチェック！

フォローする