サイトの DNS がダウンするとどうなるでしょうか?

こんにちは!
ご存知の方も多いかと思いますが、ドメイン登録とDNS解決においてPorkbunの素晴らしいサービスをご利用いただき、大変嬉しく思っております。Porkbunの素晴らしいサービスにもかかわらず、2022年9月6日午前1時49分(UTC)頃から、私のドメインの一部で約9.5時間のDNSダウンタイムが発生しました。
以下で説明するように、 Hetrix Toolsの稼働時間監視サービスは、分析のための情報の提供に役立ちました。
このインシデントが発生したことは、DNS、インシデント報告、DNS 障害防止についてさらに学ぶ機会を与えてくれたので、よかったと思います。
DDoS攻撃
PorkbunのDNSサーバーは分散型サービス拒否(DDoS)攻撃を受けたようです。このDDoS攻撃により、ドメイン名が解決できなかったため、MetalVPSウェブサイトおよびMetalVPSサーバーへの通常のドメイン名ベースの接続が遮断されました。ただし、数値IPアドレスを直接利用できるユーザーについては、該当時間帯を通して数値IPアドレスによる接続は可能でした。
MetalVPS以外にも、Porkbunにある他のドメインの一部(すべてではない)が影響を受けました。さらに、MetalVPSと個人のメールサービスもダウンしていました。
開始時間通知
Hetrix Toolsは9月5日午後6時48分(MST)に通知メールを送信しました。メールには、サンフランシスコ、シンガポール、ワルシャワのウェブサイトモニターがmetalvps.comへの接続試行中にタイムアウトしたと記載されていました。ウェブサイトモニターのメールには、「通知日時:2022年9月6日 1時48分58秒(UTC+00:00)」と記載されていました。
午後6時55分(MST)、Hetrixはニューヨーク、サンフランシスコ、ダラス、東京のpingモニターのタイムアウトを報告する別のメールを送信しました。pingモニターのメールには、「通知日時:2022年9月6日 1時55分42秒(UTC+00:00)」と記載されていました。
MSTはUTC-7です。つまり、時刻は一致しています。事件は私の現地時間9月5日の午後7時直前に始まりました。
こちらは、9月6日午前10時53分(MST)に発生したDarkstarのping障害に関するHetrix Toolsのグラフのスクリーンショットです。DNS障害による赤色のダウンタイムに加え、黄色のメンテナンスによる短時間のダウンタイムが2回発生しています。メンテナンスによるダウンタイムはカーネルの再起動によるもので、DarkstarがローリングリリースであるSlackware64-currentを実行しているために発生しています。

ウェブサイトとサーバーへの影響
DNS障害が発生している間、ウェブブラウザでmetalvps.comのウェブサイトにアクセスすることはできませんでした。これは、DNSサーバーがドメイン名を必要な数値IPアドレスに変換するリクエストに応答できなかったためです。また、同じ理由から、ドメイン名の代わりに数値IPアドレスを使用せずにMetalVPSサーバーにSSH接続することもできませんでした。数値IPアドレスが手元にないユーザーは、ウェブサイトにもサーバーにも接続できませんでした。
電子メールへの影響
事件が始まったとき、Porkbun のサポート チームが休憩できる太平洋標準時の午後 5 時の終業時間をすでに過ぎていました。
問題が解決するかどうかを確かめるために、約2時間半待ちました。それでも問題が解決しないので、Porkbunの素晴らしいサポートにメールを送る準備をしました。

メールを送信できないことに驚きました。メキシコからMigaduのウェブメールインターフェースでメールを作成したのですが、送信できませんでした。代わりに、SocketReadExceptionエラー523が表示されました。エラー523は「オリジンに到達できない」という意味なので、DNSがダウンしていたため、MigaduウェブメールがMXレコードを確認しようとしたのですが、検証できなかったようです。
DNS障害発生中はメール受信が不可能になるのは当然のことでしょう。送信側のメッセージ転送エージェント(MTA)が、受信側MTAのIPアドレスを示すMXレコードにアクセスできないためです。しかし、送信用のメールをアップロードできず、少なくともキューに登録できないことには驚きました。もちろん、すべてのドメインから独立したメールサービスから送信していれば、メールは正常に受信できたはずです。
終了時間通知
メールを送ろうとしたがうまくいかなかったので、寝ることにしました。翌朝、目が覚めると、Hetrixからサービスが復旧したという通知が届いていました。
2022年9月6日午前4時24分(MST)、HetrixはMetalVPS.comのウェブサイトモニターが「2022年9月6日 11時24分52秒(UTC+00:00)」にサイトが復旧したことをメールで通知しました。このメールには、ダウンタイムは「8時間59分」と記載されていました。
1分後の午前4時25分(MST)、HetrixからDarkstarのpingモニターが復旧したというメールが届きました。通知時刻は「2022年9月6日 11時25分47秒(UTC+00:00)」、ダウンタイムは「9時間30分」と報告されていました。
停止期間の違いは四捨五入によるものと思われます。
ポークバンと話す
障害が解消されたことを嬉しく思い、Porkbunに何が起こったのか問い合わせのメールを送ったところ、PorkbunはDDoS攻撃阻止に向けた取り組みについて素晴らしいニュースを返信してくれました。
ネームサーバーへのDDoS攻撃が発生し、一部のお客様に影響が出ました。お客様のドメインも影響を受けました。残念ながら、システムを適切に拡張できず、攻撃を阻止することができませんでした。[...]
お客様がご覧になっている状況を明確にするため、このような問題に対処するため、ネームサーバー基盤をCloudflareに移行中です。そのため、自動移行されていないドメインも影響を受けている可能性があります。今後数週間ですべてのドメインの移行を完了する予定です。現時点では手動で変更する必要はなく、移行自体が悪影響を及ぼすこともないことを改めて強調しておきます。移行が完了すれば、今回のような攻撃によるダウンタイムは過去のものとなるはずです。
何がうまくいきましたか?
幸いにも、Hetrixの監視をホスト名だけでなくIPアドレスでも設定していました。これは偶然で、事前に考えていたわけではありません。正確には、Darkstarの監視をIPv4ではホスト名、IPv6ではIPアドレスで設定していました。IPv6が接続されていたという事実から、ダウンタイムはDNS解決によるものであり、Darkstarの問題ではないことが分かりました。もちろん、IPv4ネットワークがダウンしているのにIPv6が接続されていた可能性もあり、必ずしもDNSの問題ではありませんでした。
もちろん、Porkbunと仕事をするのはいつも楽しいです!誰にでも問題はあります。でも、Porkbunと一緒に問題を解決するのは、私が知る他の誰よりも素晴らしいです。Porkbunは、私が助けを求めるたびにいつもとても親切にしてくれました。DDoS攻撃に対する防御力を向上させるために尽力してくれている彼らは、私たちの忍耐と配慮に十分値する存在です。
何を改善する必要がありますか?
私は変わった
そして
- HetrixのMetalVPS.comウェブサイト監視レポート
プライベートからパブリックへ。MetalVPS.com に IPv4 および IPv6 の ping 監視レポートを追加したいです。
特別オファー
覚えておいてください:Porkbunは、サービスがダウンしている間も素晴らしいままです! 誰でも時々ダウンタイムを経験しますが、Porkbunのお客様が受けられる親切で丁寧なサポートに匹敵するサービスは、ほとんどありません。
素晴らしいサービスと一流のサポート(私の意見ではどこよりも優れている)を体験したい場合は、 Porkbunにアクセスしてクーポン コード LOWENDBOX22 を使用すると、新規登録 1 回につき 1 ドル割引になります。新規および既存のお客様が対象です。
— @Not_Oles