狙ったロゴを作成させるためのティップスをさらに取り上げるとともに、現在のバージョンではどうにもならないくらい苦手な処理として「日本語」を描くことについて説明する。この点に関しては現在のバージョンでは実現する方法がないので、今後の改善が期待されるところだ。
連載「Copilot in Windowsを使ってみよう」のこれまでの回はこちらを参照。
対話をひとつのプロンプトにまとめる
これまで何度も取り上げてきたように、Copilot in Windowsが使っているDALL・E 3はプロンプトに対して毎回新しい画像を生成する仕組みになっている。このため、流れの中で既存の画像の一部を加工するといったような使い方は難しい場合がある。
試行錯誤をする上では対話しながら画像の生成を繰り返していく方法が便利だが、ある程度対話を行って目的とするニュアンスの画像が生成できるようになったら、これまでに対話で指示した内容をひとつにまとめて、それを1回のプロンプトで指示するようにしてみると良い。
ここでは、これまでに対話してきた内容を次のような文章としてまとめる。
現在開発部で業務の残業時間管理システムとして「時間守護」と呼ばれるシステムを開発しています。残業が特定の従業員に偏らずにだいたいどの従業員にも同じように残業の割当ができるような管理システムです。このシステムの開発に合わせて、システムのロゴを作成する必要があります。残業時間管理システム「時間守護」に合うかっこいいロゴをいくつか提案してください。ロゴには、残業時間をイメージさせるために「時計」を、業務管理をイメージさせるために見守るという意味で「ミミズク」を含めてください。立体的ではなく、平面的なデザインにしてください。背景は白にしてください。ロゴは白黒で構成してください。
この指示をプロンプトに渡すと次のように動作する。
これまでは複数回の対話のあとに生成されていたロゴが、1発目から生成されていることを確認できる。
この動作は生成AIによる画像生成において特徴的なものだ。より詳細に多くの情報を指定した方が、自分の意図する画像を生成せさやすくなる。これは生成AIがそうした仕組みで動作しているからで、この技術の特徴的な動作だ。特徴を理解し、それに合うようにプロンプトに入力を行うことが大切だと言える。
生成される画像は一期一会
生成したい画像を指定するプロンプトが定まったら、その指定を何度も繰り返して画像を生成させていく。このようにして複数の画像を生成し、その中から自分が求めているものと探っていくのだ。以下には、先ほどのプロンプト指定を繰り返してロゴデータを生成していくサンプルを示す。
上記スクリーンショットからも分かるように、Copilot in Windowsは毎回異なる画像を生成する。これはつまり、気に入った画像が生成されても、その画像には二度とお目にかかれない可能性が高いということを意味している。生成AIの画像は一期一会になりやすい。
Copilot in Windowsは過去の対話を記録しているので、過去に生成した画像に関しては履歴からたどって表示させることができる。そのため、以前気に入った画像が生成されているのであれば、履歴から過去の画像にアクセスすることができる。