デジタルデータは、今や1人当たり平均で毎秒1.7MBのデータを生み出すビッグデータの時代に突入しています。2025年までに、世界で生成、取得、消費されるデータは175ZB(175兆GB)に達すると予想されています。そこで今回は、ビッグデータに注目してみましょう。
ビッグデータとは?
ビッグデータとは、従来のデータ処理ソフトウェアでは効率的な保存と処理が全く追いつかないほど膨大で複雑なデータセットを表す言葉です。「ビッグデータ」と「データ」の違いを理解するポイントは、「3V」と称される「Volume(量)」、「Variety(多様性)」、「Velocity(速度)」の3つの特性です。
- Volume:ビッグデータという名称は、生成されるデータの量や膨大さに由来しています。毎日、300京バイト近くのデータが生み出されています。
- Variety:データソースの多様性を意味します。今日のアプリケーションは、人々のツイッター投稿、「いいね」、コメント、動画アップロードといったソーシャルデータ、産業機器やセンサーによる機械データや情報、請求書、送金・注文書や納品受領書などの取引データを保存し、処理しなくてはなりません。
- Velocity:データが生成され、分析される速さを指します。私たちは今、これまで以上に多くのデータを生み出しています。例えば、Googleは毎分380万件の検索クエリを受信し、Snapchatでは210万件の動画や写真がプラットフォーム上に投稿されます。Eメールにおいては、1億8,800万通ほどが送受信されています。速度は、それらすべてのデータが発生する速さの尺度です。
これまで長年にわたり、ビッグデータを表すには「3V」で十分でした。しかし、企業がより多くのデータを処理するようになり、この特性に下記のように新たな「V」が追加されました。
- Variability(変動性):データの絶え間ない変化
- Veracity(正確性):データソースとその文脈の信頼性
- Visualization(可視化):データが容易に理解され表示される方法
- Value(価値):データからビジネス価値を引き出す能力
では、ビッグデータはどれぐらい膨大なのでしょうか。一部の専門家は、ビッグデータは1PB(100万GB)を超えるデータ量と定義しています。しかし、ほとんどのビッグデータの定義では、データセットの量について明確な記載はありません。
ビッグデータの仕組み
ビッグデータの重要性は高まる一方です。企業は、「データの収集」、「処理」、「クリーニング」、「分析」の4つの一般的な手順にしたがって、収集された膨大なデータから意味を抽出します。ソースから生データが収集されたら、それを処理、保存し、整理します。その後、データクリー二ングで品質を向上させ、最後に分析し、パターンの判断、予測、機会の特定が行われます。
Amazonは、ビッグデータを導入した最良事例の1つといえます。同社は、顧客の検索履歴と購入履歴からデータを収集し、閲覧商品を追跡して、その情報をレコメンデーションエンジンに与えています。そうしたデータに基づいて、顧客が興味を持つ商品をプラットフォームがより的確に予測し、最終的にその後の購入につなげることができます。
ビッグデータの活用方法
今では多くの企業が、ビジネス資産としてビッグデータを活用しています。収集されたデータを基に、ビッグデータや大規模なクラスター演算・分析アルゴリズムが産業を変革しつつあります。
銀行業界では、テクノロジーが顧客体験に革新をもたらしており、ますます多くの顧客がスマートフォンで口座残高の確認、小切手の預け入れ、請求書の支払い、送金などを行っています。銀行は、そうしたオンライン上の行動によって生じたデータを利用して顧客の普段の取引習慣を把握することで、通常とは異なる顧客の行動を突き止め、詐欺を防止し、金銭的な損失を最小限にとどめることができます。
運輸業界では、ビッグデータを活用して、重大な問題になる前にトランジットギャップ(交通網断絶)を明らかにしています。都市計画事業者もビッグデータを利用して、都市が公共交通機関システムを上回る勢いで拡大する前に新たな輸送ルートを増設する時期や、タイミングの悪い信号機の撤去、駐車場不足の解消によって交通渋滞を避ける方法を正確に予測しています。
ここ数年間、ウェアラブル・デバイスもデータ生成の爆発的な増加を後押しています。医師は、遠隔地から患者を24時間監視し、より有意義なデータを受信できるようになりました。クリニックや病院では、ビッグデータによってオペレーション・マネージャーが受診者の往来をより的確に追跡できるようになり、院内での患者の待ち時間の短縮に役立っています。
ビッグデータは、私たちが日々活用しているアプリケーションの使い方に変革をもたらしています。機器がよりスマートになり、人と人のつながりがより緊密になるのに伴い、その影響力も増大し続けるでしょう。