KDDIは1月25日、LTEのモバイルコアネットワークにおいてAIを活用した障害検知システムの運用を開始したことを発表した。このシステムは、過去のパフォーマンスデータのパターンを学習して予測値を生成し、この予測値と実測値が大きく乖離している場合に異常が発生しているものとして障害検知の判断につなげている。
従来のネットワークの監視運用業務においては、ネットワーク機器から出力されるトラフィック量や接続成功数、機器のCPU利用率などの時系列のパフォーマンスデータを分析して、基準値を超えたことを検知して障害発生を判断している。今回のシステムでは過去のパフォーマンスデータとして、時間帯や平日・休日などの時系列データに関連する属性も分析しており、高精度に予測する仕組みを構築したという。
音声接続成功率などは、正常時は一定の値となるパフォーマンスデータに対しては固定のしきい値を用いて基準値を設定し異常を検知できる。しかし、トラフィック量など時間帯や平日・休日などで傾向のあるパフォーマンスデータに対しては効果的な基準値の設定が困難だ。
これに対しAIを活用した障害検知システムでは、時間帯や平日・休日などの属性を含めたパフォーマンスデータを分析することで、例えば祝日を考慮したパターンとなる予測値の自動生成などが可能となった。同社によると、監視対象のパフォーマンスデータ数を固定しきい値だけの適用に比べ6倍に拡大し、異常を検知できる可能性を高められるとのことだ。