ThousandEyesは8月23日(米国時間)、「Analyzing X’s Livestream & GitHub, Google Outages」において、過去2週間(8月5日から8月18日)にインターネット全体で発生した障害と傾向の分析レポートを公開した。レポート全文は「Analyzing X’s Livestream & GitHub, Google Outages by Cisco Podcast Network」から聴くことができる。
主な通信障害とその傾向
ThousandEyesはこの2週間に発生したインターネット上の主な障害を解説している。その概要は次のとおり。
8月12日:Google Cloudの停止
午後1時20分(世界協定時)頃、変電所の配電装置の故障により主電源とバックアップ電源の両方が故障したため、ヨーロッパのGoogle point of presence(PoP)でGoogle Cloudの障害が発生した。この障害はeurope-west2リージョンのGoogle Front End(GFE)に影響を与え、Cloud CDN、Cloud Load Balancing、仮想プライベートクラウド(VPC)、およびこれらを活用する関連サービスの可用性に影響を及ぼした。
サービスへのアクセスに対する大きな障害は午後1時50分(世界協定時)頃まで続き、可用性はある程度回復したが一部のユーザーで遅延が発生した。
8月14日:GitHubの停止
GitHub.comにおいて午後11時2分(世界協定時)頃から約36分間、サービス停止が発生。原因はデータベースインフラストラクチャに関連する誤った設定変更とされ、この変更が全データベースに影響を与えてサービスが停止したと報告されている。設定変更を元に戻すことで障害は解決しており、障害発生時は503エラーが表示され、サーバ側の問題であることが確認されている。
8月12日:XのSpaces(スペース)サービスの障害
Xの音声ストリーミングプラットフォームであるSpaces(スペース)で開催されたイーロン・マスク氏とドナルド・トランプ前大統領のライブストリームディスカッションが40分遅れで開始され、予定開始時刻に視聴しようとしたユーザーにエラーメッセージが表示された。
この障害はXへの大規模な分散型サービス拒否攻撃(DDoS: Distributed Denial of Service attack)が原因であるとされているが、ThousandEyesはネットワークの輻輳、パケットロス、遅延の増加など、DDoS攻撃を受けたときに一般的に見られるトラフィック状況を観測していないと指摘している。
ネットワーク障害の傾向
ThousandEyesは同期間におけるインターネットサービスプロバイダー(ISP: Internet Service Provider)、クラウドサービスプロバイダーネットワーク、コラボレーションアプリネットワーク、エッジネットワークにて観測された障害の傾向について報告している。その概要は次のとおり。
- 8月5日から18日までの期間を通じて障害が増加し、第1週の障害件数は183件から204件へと11%増加した。上昇傾向は翌週も続き、8月12日から18日の間に障害件数は204件から211件へと増加し、前週と比較して3%の増加となった
- 米国では上記のパターンに当てはまらなかった。最初の週(8月5日~11日)に増加が見られ、障害件数は32%増加した。 しかしながら翌週は減少し、8月12日から18日にかけて23%減少している
- 米国中心の障害は依然として世界全体の障害の40%以上を占めている。8月5日から8月18日にかけてネットワーク障害の44%は米国で発生し、その前の2週間(7月22日から8月4日)では35%だった