昨日Cloudflareに一体何が起きたのか?Flexential PDX02ジェネレータの障害が根本原因のようだ
昨日、Cloudflare のダッシュボードと関連 API サービスがダウンしました。深刻な状況でした。
Cloudflareは、データセンターに影響を与えている停電の状況を調査しており、同時にサービスのフェイルオーバーも実施しています。この問題の解決に取り組んでいます。
現在、データ プレーン / エッジ レベルで次の製品が影響を受けており、製品の全機能が部分的または完全に影響を受けています: Logpush、WARP / Zero Trust デバイス ポスチャ、Cloudflare ダッシュボード、Cloudflare API、Stream API、Workers API、Alert Notification System。
コア CDN サービスは影響を受けませんでした。
今週2回目の障害です。10月30日には、キーバリューストレージデータベース(Workers KV)のロールアウトに失敗し、Cloudflareの全サービスが30分強停止しました。
本稿執筆時点では、CF は依然として「影響を受けたサービスの復旧に取り組んでいます」 (最終更新 15:44 UTC)。
問題の核心は、Flexential社のPDX02データセンターの障害にあるようです。同社はこの問題を「データセンターに影響を及ぼす停電と、同時にサービスのフェイルオーバー」と説明しました。これは、Flexential社の他のホスティングサービス(大手共有ホスティングプロバイダーのDreamhost)が投稿したアップデートと一致しています。
どうやら電気が止まり、発電機に切り替えたところ、発電機が故障したようです(発電機の故障範囲はまだ不明です)。一部の電気は復旧したので、サイトの一部で復旧作業が進行中です。まだ約70ラックが停電していますが…徐々に復旧しつつあります。
最新情報については、 cloudflarestatus.comをご覧ください。