米Cloudflareは6月21日(現地時間)、「Cloudflare outage on June 21, 2022」と題したブログを公開し、日本でも発生していたネットワーク障害の原因について説明した。BGP(Border Gateway Protocol)に適用したアップデートにおいて、設定ミスがあったとしている。

  • HTTPリクエストの処理数に現れる障害の発生ポイント。画像は公式ブログから

Cloudflareはこれまで18カ月にわたり、世界中で特に大きなトラフィックを処理しているデータセンターの信頼性向上のため、「MCP(Multi-Colo PoP)」と呼ばれるアーキテクチャ変更に取り組んできたと説明。東京と大阪のデータセンターを含む世界中の19カ所で変更作業を継続しており、この展開作業の中に設定ミスが含まれていたという。

UTC(協定世界時)6時27分に世界中で19のデータセンターがオフラインになり、6時32分には同社内でインシデントの発生を宣言。6時58分には根本的な原因を発見して復旧作業が始まり、8時00分にはインシデントの終了を確認した。

同社はブログの最後で、「サービスの可用性を高めるために多大な投資を行ってきましたが、今回の痛ましい事故で多くのお客様の期待を下回ってしまいました。障害発生中にインターネット上のリソースにアクセスできなかったすべてのユーザーに、深くお詫び申し上げます。このようなことが二度と発生しないよう取り組んでまいります」と述べている。