米OpenAIは9月20日(米国時間)、画像生成AIツールの新版「DALL·E 3」を発表した。この新バージョンは言葉のニュアンスやディテールをより繊細に捉えられるようになっており、プロンプトに基づく画像生成をさらに直感的に行えるようになった。加えて、同社のAIチャットボット「ChatGPT」との統合が図られ、DALL·Eの画像生成に適したプロンプト作りをChatGPTに支援してもらうことが可能になった。まず10月上旬にChatGPT PlusとChatGPT Enterpriseのユーザーにリリースされ、秋にAPIの提供を開始する予定だ。
テキストから画像を生成するAIツールを用いることで、イラストが不得手な人でも、イラストを作成したり、想像を簡単に画像にすることができる。しかし、テキストによるプロンプト作りも容易な作業ではない。AIがユーザーの意図した細かな説明や使用した単語を無視することがあり、理想的な画像を得るためにはトライアンドエラーの繰り返しが必要となる場合がある。だが、OpenAIによれば、DALL·E 3は文脈理解が大きく進化しており、同じプロンプトから前バージョンであるDALL·E 2よりもテキストに忠実で高品質な画像を生成できる。
AIがプロンプトのニュアンスやディテールを汲み取る能力が向上したことで、詳細な説明がより効果を発揮するようになった。細部までこだわったプロンプトは長文になる。そこで、ChatGPTを利用することでプロンプト作成を効率化できる。ユーザーが自然な言葉で簡潔に説明すると、ChatGPTがDALL·E 3に適したプロンプトを生成する。
DALL·E 3で生成した画像は商用利用が可能だ。AI画像生成ツールが大きな注目を集める中、画像生成AIのトレーニングや生成画像がアーティストやクリエイターの権利を侵害する可能性に関する議論も広がっているが、DALL·E 3は活動中のアーティストのスタイルを模倣するようなリクエストを拒否するように設計されている。さらに、OpenAIはアーティストが自身の作品を、今後の画像生成モデルのトレーニングから除外させる「オプトアウト」の仕組みを提供し始めた。また、DALL·E 2と同様に、暴力的・憎悪的、成人向け、公人をモチーフにした画像の生成をブロックするセーフガードがDALL·E 3にも導入されている。