東京大学は、同大大学院情報理工学系研究科 知能機械情報学専攻の原田達也教授、日髙雅俊氏、木倉悠一郎氏、牛久祥孝講師が、市販のパソコンやスマートフォンに標準搭載されているWebブラウザ上で、ディープニューラルネットワーク(DNN)を高速に実行できるソフトウェアフレームワーク「WebDNN」を開発したことを発表した。

同成果の詳細は10月25日、米国カリフォルニア州マウンテンビューで開催されるマルチメディア系国際会議「ACM Multimedia 2017」において、発表される予定となっている。

WebDNNおよびKeras.jsにおける画像認識DNNの処理時間の比較(出所:東大ニュースリリース)

近年急速に発展を遂げている人工知能の一形態であるDNNは、画像や音声の認識や生成に有効な手法であるが、計算負荷が高いため、Webサービスに組み込むにはサービス提供者側がユーザ数に応じた大量の計算機を用意するか、ユーザの端末に専用アプリケーションをインストールして処理を行う必要がある。

こうした問題を解決する手段として、Webページの中にDNNの処理を行うソフトウェアを組み込み、ブラウザでこれを開いたユーザの端末上で計算処理を行わせるというアイデアが以前より提案されていた。しかし、このアイデアに基づいて作られた既存のシステムは処理速度が遅く、実用的なサービスを提供することが難しいという課題があった。

そこで研究グループは、パソコンやスマートフォンのWebブラウザ上で、DNNを大幅に高速処理できるソフトウェアフレームワーク「WebDNN」を開発した。これにより、DNNを用いたWebサービスを低コストに提供可能となり、ユーザはWebサービスのURLを開くだけで済む。また処理が端末内で完結するため、処理対象の写真等をサービス提供者側に送信する必要がなく、プライバシー保護の観点での安全性も高まる。

WebDNNでは、DNNをWebブラウザ上で高速に実行することを目的に、実行結果が変わらない範囲での計算量の削減と、端末の性能を最大限引き出すためのWeb最新規格の活用という2点の技術を開発した。

端末の性能を引き出す面では、iPhoneの標準ブラウザ「Safari」の現バージョンに搭載されている新規格「WebGPU」 が、DNNの処理でも大幅な高速化をもたらすことがわかった。また、他社のWebブラウザでも「WebAssembly」と呼ばれる最新規格への対応により、同じ端末でも性能をより有効活用することが可能となった。

また、Webブラウザ上でのDNN実行ソフトウェアとして、WebDNNおよび既存ソフトウェアのKeras.jsの速度を比較。画像中の物体を認識するDNNとして著名な VGG16などを実行し、その処理時間を計測したところ、各ソフトウェアにおいて最速の設定をした場合で、WebDNNは他のソフトウェアと比べて約50倍の速度で計算を行うことができた。

今回のWebDNNの開発により、人工知能研究のデモンストレーションや、ユーザがカメラで撮影した画像を処理するサービスなどの開発が促進されることが期待される。研究グループは、将来的にさらなる高速化やデータダウンロード時間の削減や、利用可能なDNNの種類を増加したいとしている。