Google Deepmindは8月29日(現地時間)、Googleの画像生成AIモデル「Imagen」によって生成された画像を識別するツール「SynthID」(ベータ)を発表した。このツールは電子透かしを画像のピクセルに直接埋め込むことで、人の目に気づかれにくく、また画像の見た目や画質を損なわずに合成画像を検出できるようにする。最初に、Google Cloudが提供するAI開発環境プラットフォーム「Vertex AI」でImagenを使用する一部の顧客にリリースされる。
生成AI技術の進歩により、本物と見分けられないようなコンテンツを出力できるようになったが、それを悪用して偽情報を拡散するディープフェイクの問題も深刻化している。生成AI技術を責任を持って活用できるようにするためには、AIが生成したコンテンツを識別・検出するシステムの構築が不可欠である。
画像の隅にスタンプのように押した電子透かしは、画像の見た目を損なうだけではなく、透かしの部分を切り取るだけで取り除ける可能性がある。知覚されにくい透かしも、リサイズのような簡単な編集で失われたり、画質が落ちたりすることから、画像操作に対する知覚されにくさと実用性や堅牢性の適切なバランスが課題になっている。
SynthIDは、電子透かしと識別のための2つのディープラーニングモデルを使用する複合的なアプローチを採用しており、2つのモデルを共に多様な画像セットでトレーニングしている。組み合わされたモデルは、電子透かしの入ったコンテンツを正しく識別し、電子透かしを元のコンテンツに視覚的に整合させることで知覚不可能性を向上させるなど、実用的に最適化されている。
ピクセルに直接埋め込まれた透かしは、画像自体を顕著に変化させることはなく、人の目に認識されにくい。これにより、画像、画質、画像の体験を変えることなく、しかしトリミングやサイズ変更、フィルタの追加、色の変更、JPEGのような非可逆圧縮スキームでの保存などの操作を行った後でも電子透かしを検出可能な状態を保てるという。意図的な画像操作を完璧に防ぐことはできないが、「AIが生成したコンテンツを責任を持って扱う権限を人々や組織に与えるための有望な技術的アプローチ」としている。
識別については、SynthIDは画像をスキャンして、以下の3つの信頼レベルで画像がImagenによって作成された可能性を評価する。
- 電子透かしを検出:Imagenによって生成された可能性が高い
- 電子透かしが検出されない:Imagenによって生成された可能性が低い
- 電子透かし検出の可能性あり:合成画像の可能性あり(慎重に扱うこと)
電子透かしをピクセルに埋め込むSynthIDは、メタデータを用いる他の画像識別アプローチと互換性があり、メタデータが失われた場合でも検出できるなど、デジタルコンテンツを識別する幅広いアプローチに貢献できる。また、画像だけではなく、音声、ビデオ、テキストなど他のAIモデルやモダリティとともに発展する可能性があるという。