現在、研究が進んでいる自動運転車はレーダーやセンサー(感知器)、カメラなどを用いて周囲と自身の状態を認知し、適切に行動する次世代の交通手段として多くの注目を集めている。とある大手IT企業は2020年に至るまで、ネットワークを介したクラウド分析が加速すると推察し、それ以降は深層学習を用いた学習の効率化と現実的な運用に移ると予測した。
例えばMicrosoftは、自動運転車が生み出すデータ量は1秒あたり100GBに達し、エッジ(端)からデータが生み出される時代に達しつつあるという。とある調査結果では2020年までに250億台のIoTデバイスが世界中に点在し、日々データ生成や処理を行うという。このような背景から、Microsoftは2017年5月に開催したBuile 2017で、「インテリジェントクラウド、インテリジェントエッジ」を提唱した。
既に米国政府や日本政府もビッグデータに対する取り組みを発表し、バズワード化の傾向がある。そもそもビッグデータは、その中身はコンビニエンスストアなどで購入した商品履歴や、日々送受信するメールデータやSNSへの投稿内容といった細かで複雑な情報。サーバー側に目を向ければログデータなど溜め込んだデータ全体を指す単語である。だが、注目すべきはデータの管理と活用に移行している点だ。例えば総務省はビッグデータを「事業に役立つ知見を導き出すためのデータ」と定義し、データ自身ではなく活用方法に力点を置いている。
他方でデータを管理する手法も見直されるようになった。従来のRDB(リレーショナルデータベース)は構造化データを格納することに特化し、規則性の有無がある非構造化データの扱いに窮してしまう。しかし、ビッグデータと呼ばれるデータ群は構造化されていない画像や音声、不規則的な文字なども含まれるため、非構造化データへの対応が求められている状態だ。
そこでMicrosoftは自社のパブリッククラウド上から、Azure SQL Data WarehouseやオープンソースのApache Hadoopを用いて、非構造化データから構造化データを取り出すソリューションを提供している。もちろん同様のアプローチは各社が鎬(しのぎ)を削っている状況だ。
ビッグデータは単なるデータである。だが、データが新たな価値を生み出す存在であることに気付いている経営者は多い。ビッグデータの分析から得られる洞察や気付きは社員の創造性向上につながり、企業全体の生産性を改善する。将来的には各個人の役割が変革する"スキルシフト"にも至るだろう。このような文脈の上で深く掘り下げて行けば、自(おの)ずと現在の問題点や改善点は見えてくる。
繰り返しになるがビッグデータは単なるデータだ。注目すべきはそこから得る企業の状況と展望である。
阿久津良和(Cactus)