国際ローミングの障害が国内ユーザーにも波及

8月2日に発生したのは通信障害で、海外で国際ローミング中の使用ユーザー最大約7万人、国内のFOMA、Xiユーザー最大約145万人が通信しづらい、または全くつながらないという事態に陥った。もともと別の事象かと思われたが、この2つの障害が密接に関連していることが分かった。

原因になったのは、NTTコミニュケーションズが提供する国際通話用回線で、NTT Com側の設備「IP-STP」の故障で輻輳が発生。ドコモ網と接続する設備との通信が不安定になり、接続、切断を繰り返す状態になった。これが8月2日16時20分で、翌3日の12時12分に問題は解消した。この輻輳によって国際ローミングサービス「WORLD WING」利用中のユーザーがつながったりつながらなかったりを繰り返すようになった。

国際ローミングの障害から国内回線に波及した障害

その間も、国内から多くの通話が発信されていた。携帯サービスの「根幹に関わる装置」(サービス運営部長・丸山洋次氏)である「IP-SCP」は、端末からの要求に従って通話回線を確保。要求相手が海外にいる場合に、NTT ComのIP-STPに対して要求信号が送られる。ところが、ドコモ網からNTT Com網間の通信が不安定で、要求に対する応答がなかなか返ってこない、という状況になった。

こうした場合は「40秒間」(丸山氏)でタイムアウトし、IP-SCPは要求をキャンセルするのだが、IP-SCPは発信の要求への対応を優先し、その合間にキャンセルを行う仕組みになっている。ところが今回、輻輳によってキャンセルする要求がふくれあがり、キャンセルが間に合わなくなり、タスク(キュー)がたまり続けた。

IP-SCPには、バックアップとしての予備機があり、本体が稼働しているかどうかをチェックしているが、キューがたまってチェックに応答できなくなったことで、予備機24台が稼働して本体と役割を交代した。ところが予備機も同様の結果でキューがたまり続け、最終的に予備機4台の処理能力が大幅に低下。この結果、2日18時15分から19時42分にかけて、この4台に収納された約145万人のユーザーが通話や通信ができたりできなかったり、という状況に陥ってしまった。

直接の原因は他社の機器故障による他社網での輻輳だが、それが長時間続き、キューを処理できなくなったのがネックとなった。丸山氏によれば、IP-SCPは内部の処理を監視することができず、NTT Com網の輻輳発生時は、キューがたまり続けていることに気付かなかった。異変に気付いたのは予備機が稼働した段階で、その時点でも何が起こっているかを把握できず、キューがあふれて国内の通話・通信に障害が発生して初めて問題が発覚したという。

対策では、8月中旬をめどに、信号処理機能の低下を阻止するソフトウェアの更改を実施する。通話要求とは別に要求のキャンセル処理も実施することで、キューがたまり続けるような状況を避ける考えで、「少なくとも他社網の不安定な状態が、国内の障害に結びつかないようにする」と岩崎副社長は説明。

昨年来の障害の頻発と今年1月の行政処分を踏まえて対策を進めているさなかの問題発生に、岩崎副社長も無念さをにじませる。「ドコモのネットワークへの期待は高いと思っており、期待に応えるよう取り組んできた。今回のことで、信頼が低下していると認識している。こうしたことを繰り返さないように、全社員歯を食いしばってやっていきたい」と岩崎副社長は強調する。

同社では今後も、従来の対策は一部前倒しで進めつつ、今回の障害にともなう対応も8月中旬をめどにソフトウェアの更新を行うほか、課題を洗い出しながら新たな対策を実施していく考えだ。

(記事提供: AndroWire編集部)