NTTドコモは2021年10月14日にシステム障害が発生、完全復旧まで24時間以上を費したことから、全国で多くの利用者が通信しづらくなるなど大きな問題として取り沙汰されました。この障害に大きく影響したのはIoTデバイスであり、5GでIoTの利用が急拡大する今後を考えると、その特性を見越したネットワークのあり方が問われることとなりそうです。→過去の回はこちらを参照。

IoTの設備移行トラブルが通信障害の起因に

去る2021年10月14日の17頃、NTTドコモのネットワークで通信障害が発生、同社のネットワーク利用者が全国的に音声通話やデータ通信が利用しづらくなる状況に陥りました。その後障害は長時間にわたって続き、4G・5Gは翌15日の午前5時、3Gに至っては完全回復したのが15日の22時と、完全普及にかなりの時間を要したようです。

【関連記事】
≪6Gに向けてNTTドコモが開発に力を入れる「つまむアンテナ」とは≫
≪ドコモ、5Gエリア品質向上に向け対策 - チューニングで接続成功率改善≫

障害の影響が長時間、なおかつ全国にわたって及んだことから、総務省はこの障害を電気通信事業法上の「重大な事故」に該当すると判断。NTTドコモに報告を求めるに至ったことからも、その障害の大きさと重さが理解できるでしょう。

そこで、NTTドコモは障害発生翌日の10月15日に緊急の記者会見を実施。そこで障害の原因について説明がなされたのですが、その内容によりますと、発端となったのは一般ユーザーが利用するスマートフォンなどではなく、IoT向けの通信サービスだったというのです。

  • 次世代移動通信システム「5G」とは 第55回

    NTTドコモは2021年10月14日に通信障害を発生させたことから、翌15日には緊急会見を実施して謝罪するとともに、その原因と対処について説明している

NTTドコモは障害が発生した10月14日の未明に、IoTサービス向けの加入者/位置情報サーバを新しい設備に切り替える作業をしていたとのこと。これはHSS(Home Location Register)やHLR(Home Location Register)のことを指し、要はネットワーク上のどこに端末があるかを管理する設備。基地局に接続した端末が位置情報を送り、それをHSS/HLRに記録することで、ネットワーク側が端末の場所を特定して通話や通信できるようにしている訳です。

そしてNTTドコモはIoTのサービス拡大に向け、より性能の高い設備に切り替えようとして10月14日に作業を進めていたのですが、海外のIoTデバイスがNTTドコモのネットワークにローミングで接続する際、パラメーターの問題から位置情報を登録できず、通信ができなくなるという問題が発生したとのこと。

そこで、問題回避のため一度古い設備に戻すこととなったのですが、その際IoTデバイスから位置情報を再び送ってもらい、HSS/HLRに登録し直す必要があったのです。

IoTデバイスは非常に数が多いことから、NTTドコモは20万台程度に分けて位置情報の送信をしたのですが、それでも古い設備の処理能力を超えてしまったようです。

しかもIoTデバイスの位置情報登録要求が想定を超えたことで無線通信の制御信号が大幅に増えた結果、ネットワーク全体で輻輳が起こりスマートフォンなどの通信にも影響が起きたというのです。

  • 次世代移動通信システム「5G」とは 第55回

    一連の通信障害は、IoTサービスのHSS/HLRを新しい設備に移行しようとした所不具合が発生し、古い設備に戻そうとした所、IoTデバイスから一斉になされた位置情報登録を処理しきれずネットワーク全体に影響が波及した結果、発生したものだという

NTTドコモはネットワークのパンクを防ぐため、17時37分に一度位置情報登録を100%制限する措置を取ったのですが、その際200万回線が位置情報を登録できなくなり、ネットワークに接続できなくなってしまったとのこと。その後徐々にネットワーク規制の緩和を進め、19時57分には一時回復に至ったといいます。

しかし、その後もIoTデバイスの位置情報を古い設備に戻す措置が続きネットワークがフルに性能を発揮できる状態になかった一方で、ネットワークの回復を受けスマートフォンなどからのアクセスが急増したことで混雑が発生した結果、つながりにくい状況が長く続いて結果回復が翌日まで遅れるに至ったとのことです。

  • 次世代移動通信システム「5G」とは 第55回

    通信障害の発生と回復を時系列で示したもの。19時57分に位置情報登録が回復して以降も、IoT端末の処理が続いた上に回復したスマートフォンからのアクセスが多く発生したことで、通信しづらい状況が続いてしまったという

数の多さが復旧を阻むIoTの通信障害

先にも触れた通り、一連の問題は総務省の電気通信事業法が定める「重大な事故」に当たるとされ、原因の究明と再発防止策の報告を求めるとしています。

それゆえNTTドコモ側も、旧設備で通常の運用とは異なる状態での処理能力を再確認するとともに、その処理能力を踏まえた上での適切な設備切り替えができるよう、手順を見直し、再発防止を図るとしています。

  • 次世代移動通信システム「5G」とは 第55回

    NTTドコモは再発防止のため、旧設備の性能を見直しそれに合わせて切り替え手段の見直しを図るとしている

今回の通信障害は、設備切り替え時にトラブルが生じたことがそもそもの原因ではあるのですが、注目されるのはIoTデバイスの特性が障害に結びついたことです。

IoT向け通信サービスは現状、主としてガスやタクシーなどのメーター類や自動販売機などに搭載され、売上や在庫などの情報を送るのに用いられていることから、通信量自体は非常に小さく、通信量で輻輳(ふくそう、回線にアクセスが集中すること)を起こすことは考えにくいものです。

しかしながら通信するデバイスの数は非常に多く、多数同時接続が大きな特徴の1つとなっている5Gの利用が広まれば、その数は大幅に増加することが見込まれます。それだけに今回の障害からは、IoT機器が何らかの理由で一斉に通信することで、通信量とは異なる形でネットワーク全体に高い負荷をかけ、輻輳などを起こすようになってきたことが見えてきます。

しかもIoTデバイスは非常に数が多いだけに、今回の障害でも位置情報の再登録のためかなりの時間を要し、それが障害を長引かせることにもつながっていました。とりわけ3Gに関しては、利用のされ方の違いから復旧により時間を要したとされており、デバイスの使われ方によっても復旧に時間がかかることを示しています。

そうしたことから、今回の障害はNTTドコモに限ったものではなく、どの通信事業者、さらには今後増えるであろうローカル5Gなどでも起き得るものと考えられます。実際、KDDIの代表取締役社長である高橋誠氏は、2021年10月29日に実施した決算説明会で一連の障害について言及し「ひとごとにしておける話題ではない」と話し、IoTデバイスに起因する障害の特性とその対処に力を入れていく方針を示しています。

今回の障害が注目されたのはスマートフォンの利用に影響が出たためですが、IoTの利用拡大でスマートファクトリーやスマートシティなどの本格展開が進めば、1つの通信障害が社会全体により大きな影響を及ぼすことになりかねません。それだけにIoTの利用が拡大する5Gの本格普及に当たっては、従来とは違った形で起き得る通信障害と、その対策に向けた取り組みが問われることになりそうです。