昨今、リモートワークがスタンダードになりつつあります。自宅のパソコンから遠隔操作で会社内にあるシステムを利用し、作業する人も増えているでしょう。そうした、IT社会で当たり前のように利用できているサービスや仕組みは、サーバやルータ、スイッチなどのさまざまな機器がネットワークでつながっているから成り立っていると言えます。

ところが、設置環境によってはネットワーク機器の不具合などが発生し、システムが停止してしまうケースもあります。「社内ネットワークが不通になり、重要な資料が格納されているデータボックスにリモートワーク環境からアクセスできない」といった経験をした人は珍しくありません。

「機器のフリーズ」はシステムやサービスの停止につながり、ビジネスに大きな被害を与える可能性があります。そこで本連載では、電子機器やプログラムの稼働状況を検知する「死活監視」を実践するうえで、押さえておきたい知識やポイントについて解説します。

  • 死活監視の手段の1つとなる「リブート機器」、提供:バリューソリューション

    死活監視の手段の1つとなる「リブート機器」、提供:バリューソリューション

代表的なSNMP監視、Pingやポートを介した死活監視も

「死活監視」とは、電子機器やプログラムの稼働状況を「外部から定期的に」監視することです。通常、監視のためのソフトウェアや専用機器を利用し、ネットワーク経由で機器の監視を行います。監視対象の稼働が確認できない場合に管理画面で確認したりメールなどでアラートを受け取ったりできますし、自動的に監視対象機器を再起動させることも可能です。

死活監視の代表的な方法が、「SNMP(Simple Network Management Protocol)」というプロトコルを活用したものです。SNMPによる監視ソフトウェアのデファクトスタンダードとなっているのが「Zabbix(ザビックス)」です。オープンソース・ソフトウェアのため導入コストが低いうえ、多機能できめ細かい監視設定も行えるため、多くの企業で死活監視導入に向けた最初の選択肢として検討されます。

しかし、SNMPによる監視が万能なわけではありません。Zabbixをはじめ、SNMPによる監視ソフトウェアでは監視対象機器へのソフトウェアのインストール(もしくは最初からインストールされている)が必須ですが、家電をはじめSNMPに対応できない機器が数多く存在sします。こうした課題に対応するために、SNMPだけに頼らない監視方法を検討する必要があるでしょう。

SNMP以外の死活監視としては、大きく分けて2つの監視方法があります。1つ目は「Ping監視」です。Pingは、IPネットワーク上で特定のホストに問い合わせデータを送信し、応答が返信されるかを確認するコマンドです。シンプルかつ汎用的な監視方法であり、ホストの種類や監視システムを問わず、幅広く利用することができます。

Ping監視は幅広く利用できる一方、ネットワーク層までの稼働監視しか行えないので、さらに詳細な状況を監視したい場合は「ポート監視」を利用します。ポート監視では、ポート番号への問い合わせを実施し、応答の有無や種類によってそのポート番号に紐づいた監視対象サービスの稼働状況を監視できます。

ネットワーク機器のトラブルの大半は「フリーズ」が原因

ところで、ネットワーク機器などの不具合はなぜ起こるのでしょうか。トラブルの大半は、OSやアプリケーションのフリーズが原因とも言われています。そのため、最も簡単な復旧方法は「電源の抜き差し」となります。

スマートフォンやパソコンがフリーズした時にも、一度シャットダウンしてから再起動して復旧させた経験を持つ人は多いはず。同じ要領で、実はネットワーク機器のフリーズ時には電源の抜き差しで復旧対応をするケースがほとんどなのです。

しかし、停止した機器が多くの人に影響を与えるものであった場合、管理者は気軽に触ることができないかもしれません。例えば、オフィスの全社員が利用している光回線ルータや、飲食店のお客様向けに無料Wi-Fiを提供するためのルータなどを、管理者の独断で操作することは非常に大きなストレスとなり、他のシステムにも影響を与えかねません。

そのため、管理者のほとんどは機器の保守管理会社に連絡します。しかし、万が一、設置場所が遠方だった場合、復旧のために時間と交通費がかかってしまいます。そもそも、機器の電源を入れ直すだけで済むのに、移動が発生し、そのために復旧までに時間がかかってしまうのは無駄と言えるでしょう。

遠隔で電源を制御できるリブート装置、機器選定ではアプリケーション監視に注目

「わざわざ移動せずに、遠隔で機器の電源を落とせないだろうか」という保守現場の声に応えるべく登場したのが「リブート装置」です。リブート装置は、機器とコンセントの間に設置することで電源供給を制御することが可能で、機器に異常が発生した場合に自動的に再起動することができます。

保守管理会社にとっては、無駄な技術担当者の派遣を減らすことができるでしょう。事業者側にとっても、ITサービスの早急な復旧につながるため、リブート装置は「業務のダウンタイム縮小」を実現する機器と言えます。

保守現場をサポートするリブート装置とはいえ、リリースされている製品の種類は限られています。多くの企業が保守管理会社の技術者派遣に頼っているという実情があり、まだまだニッチな業界と言わざるを得ないでしょう。

また、リブート装置には、アプリケーション監視ができるものとできないものがあります。 リブート装置の大きな役割は機器の正常稼働を保つことであり、そのためにアプリケーションがきちんと起動しているかどうかの確認が重要となります。アプリケーションの起動を監視するのがポート監視なので、機器選定時にはポート監視機能の有無をチェックしましょう。

  • リブート機器と監視ソフトウェアの機能比較表。監視ソフトウェアは、(インターネット経由を含めた)ネットワーク上からサーバなどの機器監視を行うPC上で稼働するツールの総称

    リブート機器と監視ソフトウェアの機能比較表。監視ソフトウェアは、(インターネット経由を含めた)ネットワーク上からサーバなどの機器監視を行うPC上で稼働するツールの総称、出典:バリューソリューション