2023年4月3日午前、東日本電信電話(以下、NTT東日本)および西日本電信電話(以下、NTT西日本)が提供している「フレッツ光」を含む光アクセスサービスと、「ひかり電話サービス」が利用できない、または利用しづらい通信障害が発生していた。
4月3日に発生した通信障害の概要
NTT東日本とNTT西日本は4月28日、総務省に対し重大な事故報告書を提出し、同省はこれを受領したことを明らかにした。両社は同日に記者会見を開いた。なお、本件はひかり電話サービスが、電気通信事業法施行規則第58条における緊急通報を取り扱う音声伝送役務の「障害時間1時間以上」「ユーザー数3万以上」に該当する。フレッツ光は報告に該当しない。
通信障害の影響が生じたのは、NTT東日本エリアでは北海道、東京都、神奈川県、埼玉県、千葉県、新潟県、NTT西日本エリアでは大阪府、滋賀県、岐阜県、石川県、富山県、福井県、島根県、鳥取県、愛媛県、徳島県だ。NTT東・西合わせて最大44.6万回線に影響が出たと見られる。
4月3日の午前7時10分に発生した障害は、NTT東日本で8時53分(発生時間1時間43分)、NTT西日本で8時49分(同1時間39分)まで続いた。なお、NTT東日本の一部エリアにおいてのみひかり電話回線にエラーが生じ、10時8分に回復している。
なお、現在までに不具合の原因となった内部処理の設定変更の有効性を確認し、障害の原因となった加入者収容装置へ適用している。
なぜ通信障害が発生したのか?
障害は全国のNTTビルに設置した加入者収容装置のうち、特定の機種において発生した。加入者収容装置とは、ひかり電話を含む光アクセスサービスを提供するため、ユーザーの回線を集約するとともに上位の中継装置へパケット送受信する機器だ。同一機種でも、障害が発生した機器と発生していない機器がある。
光アクセスサービスで提供しているインターネット通信やひかり電話サービスの音声通信は、すべて加入者収容装置を通過する。障害が発生した機種は2018年度から導入しているもので、これまで約5年間稼働しているが、同様の事象はNTT東日本、NTT西日本ともに発生していない。
今回の事象は、加入者収容装置の内部処理にメーカー未確認のソフトウェア不具合が内在しており、コンテンツ配信サーバからのマルチキャストパケットの受信において、複数の条件が偶然重なったことに起因するという。加入者収容装置のパケット転送部が再起動と切り替わりを繰り返したことで、サービスに影響が生じた。
マルチキャストパケットとは、複数の通信相手先を指定して行う通信を指し、大容量かつ多数の拠点へのデータ配信に利用される。今回の事象の原因となったパケットは標準仕様(RFC:Request for Comments)に準拠したものであり、悪意のあるサイバー攻撃の痕跡はないとのこと。
具体的には、加入者収容装置のパケット転送部において障害が発生したという。このパケット転送部のハードウェアは冗長化のために二重構成となっていたものの、今回はソフトウェアの不具合が直接の原因となったようだ。
再発防止策
今回の大規模な通信障害は、複数の通信相手に一斉配信するというマルチキャストパケットの特性が影響を与えている。また、通信機器メーカーが認識していなかった未知の不具合が内在していたことも、障害が大規模化した原因と考えられる。なお、加入者収容装置のパケット転送部では同一のソフトウェアおよび設定内容で再起動が繰り返されており、手動による再起動でも正常化できなかったことから障害が長期化している。
NTT東日本の執行役員 島雄策氏は「本事象の直接的な原因は装置のソフトウェアの不具合だったが、発生した不具合はメーカーでも認識していなかったと報告を受けている。こうした未知の不具合に対して、社会インフラを支える電気通信事業者としてどう対処するのかが、本質的な課題として浮き彫りになった」と述べ、沈痛な面持ちを見せた。
同氏は「機器の未知の不具合は今回の当該メーカーだけに発生するものではない。他のメーカーにも起き得ることを踏まえると、リスクを事前に低減して安定した通信サービスを提供するためには、従前の通信事業者とメーカーという枠組みを超えた新しい関係性の構築が求められる。通信事業者としての責務を果たしたい」とも述べている。
今後、NTT東・西は通信機器メーカーとの新たな連携体制を構築するため、両者が一体となってリスク項目の洗い出しを強化する。装置の再起動を繰り返さないようにするための「フェールセーフ機能」などの共同検討に着手するそうだ。
また、不具合発生時における迅速な対応を目的とし、メーカーとの合同訓練など情報連携を強化する。その他、開発部門以外の第三者組織でリスク評価する体制の構築など、社内におけるリスク評価体制も確立する方針だ。