GitHubは10月11日(米国時間)、「GitHub Availability Report: September 2023 - The GitHub Blog」において、2023年9月の可用性レポートを公表した。GitHubサービス全体のパフォーマンスを低下させるインシデント2件を報告している。

  • GitHub Availability Report: September 2023 - The GitHub Blog

    GitHub Availability Report: September 2023 - The GitHub Blog

1件目のインシデントは2023年9月5日16時24分(協定世界時)に発生。GitHubのプライマリデータベースの1つに障害が発生し、複数のGitHubサービスの停止またはパフォーマンスの低下が発生したという。SAMLログインが影響を受け、GitHub Actions、GitHub issues、プルリクエスト、GitHub Pages、GitHub API、Webhooks、GitHub Codespaces、GitHub Packagesへのアクセスにも影響があったとされる。

最初のアラートから17分後に手動で正常なホストへのフェイルオーバを行い、2分後に作業を完了して影響を軽減している。今後の対策として、同様の障害を検出して自動でのフェイルオーバを可能にする改善と、再発の可能性を減らすためのパッチを適用したとしている。

2件目のインシデントは2023年9月19日20時36分(協定世界時)に発生。GitHub Projectのプライマリデータストアの移行中にGitHub Projectsのデータの95%が3時間半にわたり利用できなくなったという。原因はGitHub Projectsデータベースのプライマリテーブルのインデックス制約の設定ミス。これにより20時36分から翌0時06分までの3時間半の間、GitHub Projectsが完全に利用できなくなったとされる。

その後、GitHub Projectsのデータはインシデント発生前の状態に復旧し、インシデント発生中にユーザーが作成した新しいデータは4時28分までに復旧したという。同様のインシデントを防止するため、データ移行の検証の改善、データ移行の制約の評価と改善、データの復元とレプリケーションの問題の修正にかかる時間の短縮などの改善を進めているという。

GitHubは定期的に可用性レポートを公開しており、リアルタイムの稼働情報を「GitHub Status」から確認することができる。