リアルタイムで適切なシステム監視をすることでシステム障害を未然に防ぐことがディフェンス的であるならば、リアルタイムで適切なシステム監視をすることでビジネス上の意思決定をリアルタイムに行うというオフェンス的な行動をとることができる。最終回では、まさに一石二鳥となるこの施策を実現する方法について紹介する。

ビジネス監視という考え方

毎週・毎月の会議で、売上高の推移、予約率の状況、会員登録の増減などについて報告検討をすることがあるだろう。複雑な意思決定であれば、このような会議で議論することが欠かせない。しかし、「あらかじめ想定できる事象にあわせて機械的に意思決定を下す」ことが許されるのであれば、それはシステムに任せてしまえばよい。

ITシステムをリアルタイムに監視していれば、ITシステムで支えているビジネスをリアルタイムで監視することができる。このような活動はCEPで実現できる。

CEPとは

CEPの処理は(1)データ収集、(2)評価・分析、(3)アクション、の3つのフェーズに分けられる。

(1)データ収集

サーバーやストレージ、ネットワーク機器から採取できるログデータ、売上高や納期、仕入価格などの業務データを格納しているデータベースから得られる構造化データ、最近では、ビッグデータと呼ばれるソーシャルメディアなどで得られるデータやセンサーから取得する準構造化データ、動画・音声・ドキュメントなどの非構造化データなどを収集する。

(2)評価・分析

ITリソース視点で捉えた測定指標とビジネス視点で捉えた測定指標の複数条件を組み合わせて統合的に評価・分析する。評価・分析には自社独自のシナリオを作る必要がある。

(3)アクション

評価・分析の後は、あらかじめ設定したビジネスの意思決定を行う。例えば、Webページの応答速度が正常値範囲の±10%を越え、かつ客単価が3000円を下回った場合は、10%オフのキャンペーンバナーを掲載するというアクションをとることである。つまり、「もしAだったらBをする」の「A」が評価・分析であり「B」がアクションである。前述の例にあった株式の売買、マーケティング施策の実行、ITリソースの追加、アラートの表示などは全てアクションである。

CEPの概念

ある製品生産工場では、製品品質維持の研究を行い、一定レベルの品質を維持するための関係要素を何十候補と洗い出し、相関性の分析を行った際に、温度や湿度などの非常に少数の指標だけをモニターしていれば歩留まり率を数%以下で収められることを突き止めた。各種センサーの情報や生産情報などを収集し(データ収集)、歩留まりとの相関分析を行い(評価・分析)、欠品率が最低になるしきい値(温度や湿度など)をあらかじめ設定する(アクション)ことを行っている。

CEPやシステム監視ツールの導入

CEPにおいて重要な要素は、どのような情報を投入してどのような観点やメトリクス(測定指標)で分析するのかである。CEPベンダー各社が提供している製品では、分析シナリオのロジックをプログラミングする必要がある。

しかし、CEPベンダーが提供する製品に依存したプログラムで分析シナリオを開発しなくとも、自らが得意とするスクリプト言語を使って分析シナリオを開発すれば良い。CEPのような高価な製品でなくとも、システム監視のツールを導入すればできることもあるだろう。

試行錯誤でCEPの運用

どのデータを、どのタイミングで、どのように分析して、どのようなアクションにつなげれば良いのかを導きだすことは非常に難しい。一般的な統計解析手法では難しいため、米国で利用が進んでいる共分散構造分析を使うのも有効だろう。

共分散構造分析はビジネス想定を仮説モデルとして構築し、仮説の検証を行い相関度を分析していく手法である。つまりビジネス仮説が想定通りであったのか否かが解明できるため、仮説構築と検証作業というサイクルを回していけば精緻な分析シナリオを作ることが可能になる。

分析シナリオはIT部門のメンバーが中心となって開発する必要は無い。どちらかと言えばビジネス目標の達成責任があるビジネス部門のメンバーが中心となって、「もしAだったらBをする」という仮説モデルを作ることが必要である。

データ・サイエンティストの活用

分析シナリオを開発するための仮説構築と仮説検証を行うのは自社内のメンバーで行うべきで、前述したように、CEPベンダーに任せることは丸投げになってしまうので避けなければならない。しかし、一方では、自社メンバーだけでは既成概念にとらわれてインサイト(洞察)を得られない可能性もあるため、社外のデータ・サイエンティストやデータ・アナリストにアドバイスを求めるのも有効だろう。

データ・サイエンティストやデータ・アナリストはデータとビジネスの関係を発見し、考えうるモデルを提示したり、様々な情報からインサイト(洞察)を得たり、仮説モデルを構築して検証することができるスキルと経験を持つスペシャリストのことをいう。

まとめ

システム障害が繰り返される理由は以下の2点だ。

・ITの利用部門の当事者意識が希薄でシステム障害への感度が低い

・システム構築時のサイジングミス

システム障害を繰り返さないための施策は以下の2点となる。

・システム・サイジングは「経験、勘、度胸」ではなく、「仮説構築、検証、データ分析」という科学的なアプローチにする

・リアルタイムでシステム監視を行い、サイレント障害を発見し対処する

サイレント障害を発見できるリアルタイムなシステム監視(キャパシティ・マネジメント)を通じて、ビジネスを監視して(パフォーマンス・マネジメント)、スピーディーな意思決定を行ってアクションする(CEP)ことで、企業競争力をつけられる。

企業の経営者も利用部門責任者もIT責任者も、ぜひパフォーマンス・マネジメントとキャパシティ・マネジメントとCEPを行って、ダウンしないITシステムを使い倒してビジネスと直結させ、本来のビジネス目標を達成していただきたい。

執筆者紹介

寺澤 慎祐 (てらざわ しんすけ)

日本サイトラインシステムズ株式会社 シニアコンサルタント 兼 株式会社アイトップ 代表取締役

分析指向マーケティングとITマネジメントのスペシャリスト。サン・マイクロシステムズを退職後、企業向けにマーケティングマネジメントとITマネジメントのコンサルティングを行っている。光産業創成大学院大学においてB2Bマーケティングの講師も務める。