ThousandEyesは3月15日(米国時間)、「Meta, LinkedIn, and Comcast Outages, Explained」において、過去2週間(2月26日から3月10日まで)にインターネット全体で発生した障害と傾向の分析レポートを公開した。レポート全文は「Meta, LinkedIn, and Comcast Outages, Explained - YouTube」から視聴することができる。

  • Meta、LinkedIn、and Comcast Outages、Explained

    Meta, LinkedIn, and Comcast Outages, Explained

主要なインターネットサービスの通信障害

ThousandEyesはこの2週間に発生したインターネット上の主な障害を解説している。その概要は次のとおり。

2024年3月5日、MetaのFacebook、Instagram、Messenger、Threadsなど一部のサービスに予期せぬ障害が発生

各サービスのログインページは表示されるが、その先に進むことができない状態となった。障害は午後3時17分(協定世界時)頃に発生。午後4時50分(協定世界時)頃から徐々に回復しはじめ、午後6時40分(協定世界時)までに大部分が回復した(参考:「FacebookやInstagramに障害、多くのユーザーがアクセス不能 | TECH+(テックプラス)」)。

2024年3月5日午後7時45分(協定世界時)頃、Comcastネットワークの一部で障害発生

Amazon Web Services(AWS)、Salesforce、Webex by Ciscoなどのアプリケーションやサービスの接続に影響を与えた。この障害はテキサス州にあるComcastのネットワークバックボーンを通過するトラフィックに影響を与えたとみられている。

2024年3月6日(協定世界時)、LinkedInに1時間近くサービスを利用できない障害が発生

ネットワークには異常が見られないことから、LinkedInのバックエンドで障害が発生した可能性がある。ThousandEyesは、障害発生中にサーバからHTTP 503(サービス利用不可)およびHTTP 502(バッドゲートウェイ)エラーの応答を確認している。

2024年3月5日(協定世界時)、Discordの一部ユーザーに障害が発生

障害は発生から34分後に解消された。Discordは復旧作業について「初期セッション開始時の問題を引き起こしたレート制限の更新と、初期復旧時にギルド(Guild)のロードを制限した内部サービスのスケーリングターゲットを見直している」と説明している。

2024年2月27日(協定世界時)、衛星放送サービス「DirecTV」の静止衛星の測位に不具合発生

放送を視聴できない状態となった。障害発生から約24時間後に衛星の位置を修正して復旧した。

ネットワーク障害の傾向

ThousandEyesは同期間におけるインターネットサービスプロバイダー(ISP: Internet Service Provider)、クラウドサービスプロバイダーネットワーク、コラボレーションアプリネットワーク、エッジネットワークにて観測された障害の傾向について報告している。その概要は次のとおり。

  • 2024年2月の最終週から3月にかけて世界的な障害の総数は減少を続けた
  • しかしながら、米国は59件から70件に増加した
  • この期間の障害のおおよそ半数(45%)は米国で発生した。前回のレポートでは40%を下回っていたが、障害が米国を中心に発生するという従来の傾向に戻った
  • 過去8週間のネットワーク障害件数 - 引用:ThousandEyes

    過去8週間のネットワーク障害件数  引用:ThousandEyes

まとめ

この2週間(2月26日から3月10日まで)ではMeta、Comcast、LinkedInの障害が立て続けに発生するという興味深い現象が観測された。ThousandEyesはこのような障害への備えとして、バックアップソリューションと回復プロセスの導入の重要性を訴えている。また、需要の急激な上昇に合わせたバックアップの拡張についても事前に備えておくことを推奨している。