OpenAIは11月3日(米国時間)、ベータ提供中の画像生成AIツール「DALL·E 2」のAPIをパブリックベータとして公開した。
DALL·E 2は、利用者が入力した文章から、その説明を表現した画像を自動生成する。今年4月の発表で注目を集め、7月に参加者数を100万人に制限した招待制のベータプログラムを開始。9月に人数制限をなくし、現在は利用者数が300万人以上。1日に400万枚以上の画像を生成している。サービスの特徴としては、自然言語による記述に対応し、アーティスティックからフォトリアリスティックな画像まで多様なオリジナル画像を作成・編集できる柔軟性を持つ。
画像生成AIについては、偏見やフェイクが反映されたり、不適切な画像の生成、著作権問題の可能性が懸念されているが、OpenAIは製品化を見据えて学習に用いるデータセットを調整し、ポリシーに違反するコンテンツの生成を拒否するフィルター機能や悪用を阻止するための検出技術を導入してきた。人数を制限したベータ期間を経てサービスの安全性と信頼性を確立しており、APIについても開発者がリスクを懸念することなく「構築に集中できる」としている。
OpenAIのAPIを利用するパートナー企業のいくつかがすでにDALL-E APIを採用している。その1つであるMicrosoftは、グラフィックデザイン・アプリ「Designer」にDALL-Eを組み込んだ。チラシ、招待状、SNSのリッチな投稿などを作成する際に、テンプレートから選ぶのではなく、デザインのアイディアを言葉で表現して形にする。また、Bingにも統合し、ユーザーが探しているものがWebから見つからない時に画像を生成する機能を提供する(Image Creator、画像作成者)。
ファッション・ブランドの展開をサポートするデジタルプラットフォーム「CALA」は、デザイン・プロセスにDALL-Eを活用し、自然な言葉による説明と参考画像などを使って新しいデザインのアイディアを生成できるようにした。
DALL-Eは、GPT-3、Embeddings、Codexなどで構成されるOpenAIのAPIプラットフォームに加わった。現時点で用途の審査などはない。料金は生成する画像1枚あたり、解像度1024×1024(0.02ドル)、512×512(0.018ドル)、256×256(0.016ドル)となっている。