猫、カエル、髪の毛、椅子・・・。デバイス上で簡単に描ける落書きにどんな価値があるのか。そう思う人も多いだろう。Googleが2016年の11月から開始している「Quick, Draw! The Data」は、文字で表示される数秒、数十秒と短い時間で落書きしていくWebゲームであると同時に、ニューラルネットワークなど開発者が機械学習で活用できるデータセット(GitHub)になる仕組み。書いている間にも吹き出しからは、私はカエルに見える、蜘蛛に見える、星に見えるなどニューラルネットワークがその絵を推測し続ける。
Googleは現地時間8日、公式ブログに"A look at one billion drawings from around the world"と題した記事を投稿。このQuick, Draw! The Dataを通じて、10億の落書きデータが集まったことを報告している。
個々の特徴は異なるのに、離れるとほぼ同じになる雪の結晶、髪の毛や耳と同様に個々の落書きは異なるが、離れてみると大半が笑顔(Smile)が多いことに気がつくなど機械学習を使わずとも垣間見える特徴や共通点。"椅子"の描き方や"星"の描き方など国や地理的に見える相関関係の例など数多くの落書きを例示しながら、"これらどこの誰が書いたかがわからない単純な10億の落書きが教えてくれることは、私たちの周りにいくらでもあるものを通じて、一緒に楽しめること"と述べている。
これらの落書きは、ニューラルネットワークのモデル"sketch-rnn"などの機械学習技術を用いてデータの精度を高め、GoogleのAI Experiments内AutoDrawなどにも活用されている。AutoDrawツールを使ってドローするとキャンバス上部にその都度推測候補を提示、選択するというものだ。気楽に書いた線で思い通りのイラストが表示されるととても心地よい。「Quick, Draw! The Data」のWebサイトを見ると、現在公開されているデータは345カテゴリの5千万落書き。まだまだディスカバーしていない落書きはたくさんありそうだ。