ThousandEyesは9月29日(米国時間)、「Internet Outages: One Small Link Can Break the Whole Chain」において、最近のインターネット全体の障害とトレンドの分析結果を伝えた。
ThousandEyesによると、2023年9月11日から17日までの過去1週間における世界的な障害発生件数は229件でその前の週から24%増加し、その次の週は減少に転じたとされる。米国を中心としてみた場合も同様の障害発生パターンが観察されている。このパターンは例年と同じで、9月に入ると障害が増加する傾向にあるという。
ThousandEyesはこの期間中に発生した障害として、次の5つを取り上げて解説している。
.auドメインの名前解決に失敗
オーストラリアの.auトップレベルドメイン(TLD: top-level domain)管理者のauDAが、DNSSECキー署名エラーにより最大1時間にわたり名前解決できない状態となった。原因は再署名キーの有効期限が切れていた可能性があると指摘されている
Salesforceの停止
2023年9月20日(米国時間)に複数のクラウドサービスでログインできないなどの障害が4時間半にわたり発生した。原因は、セキュリティポリシーの変更により過度にサービス間の通信が制限されたためとされる
Microsoft Azureの停止
2023年9月16日(米国時間)にAzure SQL Databaseの一部顧客のデータベースへの接続に問題が発生した。原因は短時間の停電とされる。復旧時に手動での対応が必要となったが、チーム間の齟齬により復旧が長引いたという
PlayStation Networkの中断
2023年9月19日(米国時間)にPlayStation Networkで問題が発生し、特定のゲームをプレイすることができなくなった。このインシデントではサインインや新しいセッションを開始しようとすると、HTTP 500エラーが表示されたという
Microsoft Teamsの停止
2023年9月13日にMicrosoft Teamsにおいてメッセージの送受信に遅延や失敗が発生した。この問題は影響のあるトラフィックを健全なインフラに迂回させて緩和させることで解決した
ThousandEyesはこれら障害が、些細な問題から大きな問題に連鎖的に拡大してサービス全体の停止に至っている傾向が見て取れるとして、オンラインサービスを展開する企業に注意を促している。