SNSの普及やIoTの発展とともに、多様でかつ膨大なデータが収集可能な時代になってきた。しかし、これらビッグデータをビジネスに十分生かしきれていないのが日本の現状だ。こうした状況を招いている要因の1つに、欧米と比較して日本ではデータサイエンス教育が遅れており、データを活用できる人材が不足していることがある。
データサイエンティストに限らず、実際のビジネスの現場において定量的なデータに基づいて物事を考えられるデータサイエンスの素養のある人は、意外と少ないのではないだろうか。
こうしたなか、データサイエンスに対する世の中の理解を深めるべく、SAS Institute Japanは8月4日と5日、小学2年~6年生を対象としたイベント「なつやすみ親子でデータサイエンス」を開催した。本稿ではその様子や狙いについてお届けしたい。
SASのツールを使わないワケとは
今年で3回目となる同イベントは、SAS日本法人独自の取り組みだという。自身の子どもに統計やデータサイエンスの楽しさを体験できる機会を与えたいという同社社員の思いがきっかけとなっている。SAS Institute Japan 代表取締役社長 堀田徹哉氏は、同イベントについて、「統計やデータサイエンスに興味を持ってもらう、保護者と仲良くなってもらう、夏休みの自由研究に役立ててもらう、という一石三鳥のイベント」と説明する。
同イベントの特徴は、よくある小学生向けのプログラミング教育とは異なり、かなり"アナログ"な点だ。調べものをしたりデータを集計したりする際にパソコンを多少利用することはあっても、実際にSASのツールを利用するシーンはない。参加者の子どもたちは、事前に調べてきたデータをもとに、点や線を手書きでプロットしてグラフを作成していく作業を行う。
これは実際に手を動かしてみることで、数字を使って考えることの喜びを実感して欲しいというSAS側の意図がある。堀田氏は「イベントでは、数字に対する興味とそこから何らかの結果を導き出す楽しさを引き出すことに重きを置いている。データから結果を導出するまでの過程をブラックボックス化せずに理解することが大切」と語る。
また、SASでは貧困や健康、教育、地球環境といった人道問題の解決に向けた「Data for Good」の取り組みを行っており、今回のイベントもその一環として社員のボランティアスタッフによって運営されている。子どもの教育という側面だけでなく「社員にとっても貴重な機会であると位置づけている」(堀田氏)という。
「仮説・検証・考察」というデータサイエンスの流れを体験
当日は約20組の親子チームが参加した。参加者は事前に配布された資料に沿って、「分析テーマの設定」「仮説を立てる」「仮説に基づいたデータの収集」の準備を行ってから来場している。
例えば、「気温と電気の使用量」をテーマに設定したとすると、「エアコンを使う夏が一番電気の使用量が多いのでは?」などという仮説を立て、自宅の電気使用量のデータを集めたり、一般に公開されている気象データを探したりしてデータを収集する。
そしてイベント当日は、SASの社員スタッフのサポートの下、準備してきたこれらのデータを分類・集計して、データを視覚化していく作業を行う。また、事前に設定した仮説が正しかったかどうかについても、データに基づいて検証・考察していく。最後にこれらの作業の成果としてポスターを作成し、参加者の前で1分間のプレゼンテーションを行い、成果をアピールする。選ばれたテーマは小学生ならではの視点のものが多かったが、仮説・検証・考察というデータサイエンスの手続き自体は非常に本格的なものだ。
あらかじめSAS側でサンプルデータを用意していないのは、現場のデータサイエンスを体験してほしいという狙いがある。実際のデータサイエンスの現場では、データの選定・準備がもっとも重要なポイントとなるためだ。また、データを分析してみると、事前に立てた仮説が間違っていたというケースもありうるが、これもビジネスの現場では重要な気づきの1つになる。
さらに、いくら良い分析を行ったとしても、人に伝えてビジネスに生かされなければ意味がない。棒グラフ、折れ線グラフ、帯グラフ、円グラフを効果的に使い分けるなどして、わかりやすく説明することの重要性についても説明されていた。
「日本の果物はどこへ行く?」が最優秀賞
イベントの最後には、SASの社員がそれぞれのポスターを審査し、投票を行った。この結果、「最優秀賞」には日本の果物の生産量と海外への輸出量について調べたポスター、「アイディア賞」には世界中の挨拶の言葉の音数について調べたポスター、「ビジュアル賞」には公園に設置されている自動販売機の数を調べたポスターがそれぞれ選ばれた。
小学・中学・高校での早期の統計教育の重要性と課題に取り組む、文部科学省 国立教育政策研究所 教育課程研究センターの佐藤寿仁氏は「ひとつひとつに賞をあげたいくらい、どれも良い作品だった。ほかにどんなことを調べてみたらおもしろいか、自宅でも考えてみてほしい」と講評していた。
佐藤氏のコメントのとおり、表彰された作品以外にも、小学生ならではの素朴な疑問を出発点としたテーマに対してデータの見せ方や調査方法を自分なりに工夫した作品が多く、大人が聞いていても、つい「なるほど」と声が出てしまいそうな興味深い結果を発表している子どもたちが多かったのが印象的だ。
AI技術が進歩している昨今だが、ビッグデータから得られた結果に意味を与えるのは、まだわれわれ人間の仕事である。早期からこうした教育を受けてデータサイエンスの素養を身につけておくことは、AI、ビッグデータ時代を生き抜くにあたって非常に有意義であると感じた。