富士通研究所と熊本大学は5月10日、加速度センサやジャイロセンサなどの時系列データに対して、AIを適用する上で必要な教師データを簡単に作成できる技術を開発したと発表した。今後、さまざまな分野の時系列データを用いた実証実験を進め、富士通のAI技術「FUJITSU Human Centric AI Zinrai」の時系列データ向け前処理技術として2019年度中の実用化を目指す。

センサから得られる時系列データは、それぞれの瞬間での値が数値で記録されているだけのため「いつ」(区間)、「何を」(ラベル)したかを付与してデータに意味づけを行い、AIが学習するための教師データを作成する必要があったという。

例えば、ランニングの際の加速度センサのデータでは、走っている状態、歩いている状態、止まっている状態などが混在しており、これらのデータをAIに学習させるには、それぞれのデータを区間に切り分けて「走っている」「歩いている」「止まっている」といったラベルを付与した教師データを作成する必要がある。

従来、このような教師データを作成するには、時系列データを測定している最中にビデオで振るまいを録画し、秒単位で変化する数値に対してどの振るまいをしているのか照合した上で、人手でラベルを付与するのが一般的であり、負担と時間がかかるため時系列データのAIへの適用が進まず、ラベル付与作業の手間を削減する自動化技術が求められているという。

今回、両者は複数の動作を含む場合でも、主に「何を」しているかを表すラベルを長区間(例えば1時間)につき1つ入力するだけで、時系列データのAI利用を可能とする高精度な教師データを自動で作成する技術を開発した。新技術の主な特徴は「適切な区間抽出」「高精度なラベル付与」の2点。

  • 開発技術の全体像

    開発技術の全体像

適切な区間抽出では、時系列データの中で同じ動作が継続している時の特徴と動作が変化する時の特徴を学習し、時系列データから同じ特徴を持つ動作の時間帯を適切に自動抽出することを可能としている。

高精度なラベル付与については、例えば長区間(例えば1時間)ごとのデータに対して、大半が走っている場合には「走っている」という大雑把なラベルを1つ付与しておき、これらのラベルを予測できるようにディープニューラルネットワークを学習させたあと、学習済のディープニューラルネットワークを用いて時系列データを読み込ませ、結果として出てきた推定ラベルから時系列データのどの区間が最も予測に寄与したかを計算する。その寄与度が高い時間帯をラベル候補として集計していくことで、高度な予測が可能な教師データを作成できる。

効果としては、工場における研磨などの作業を模した動作からなる加速度センサの時系列データに対して、ラベルを付与する実験を実施したところ、92%の時間帯で正しくラベル付けができたことを確認し、これは人手でラベルを細かく付与したデータを教師データとした時と同等の高精度な結果であることが認められるという。

新技術により、時系列データからAI用の教師データを容易に作成できるため、センサがとらえた特徴をAIが判断するような機能の開発が進むことが期待されることに加え、時系列データの数値の特徴だけから判断を行い、センサの種類には依存しないため、例えば温度センサや脈波センサなどにも適用を可能としている。