「MXroute が失敗しました。申し訳ありません」: Jar が最近の Man vs. Storage Array の戦いの詳細な物語を投稿

「MXroute が失敗しました。申し訳ありません」: Jar が最近の Man vs. Storage Array の戦いの詳細な物語を投稿

MXルート MXr​​outeは数日間、サーバーの1台に深刻な障害が発生したため、苦境に立たされていました。サーバーの障害には様々な原因があります。CPUの故障、RAMの不良、ネットワークの不安定さなどです。しかし、最悪なのはストレージ障害です。そして、まさにLucyというサーバーに起こったのです。

MXr​​outeのオーナーであるJarland Donnell氏が、非常に興味深い長文の根本原因分析を公開しました。学ぶ価値のある点がいくつかあります。

  • 従来のバックアップ ツールを使用して巨大なサーバーをバックアップするのは、少なくとも復元となると非常に困難です。
  • ソフトウェア ベンダーは必ずしも最も役立つ設定をデフォルトに設定するとは限らないため、ベンダーが出荷したものが必要なものだと想定するのは危険です。
  • MXr ​​oute は、RAID10 アレイに極度の負荷がかかると、1 つのドライブがビジー状態になり、RAID アレイから外れてしまう可能性があり、その問題が 2 番目のディスクに波及すると、そのストレージは終了してしまうと理論づけています。

映画『レポマン』に、ハリー・ディーン・スタントンが若い弟子に語る素晴らしいセリフがあります。「ほとんどの人は緊張した状況を避けながら人生を過ごす。レポマンは緊張した状況に身を投じながら人生を過ごす」。システム管理者にもよくあることです。真夜中の闇の中でシステムを復旧しようと奮闘する勇敢な人々の物語を読んでいると、過去のキャリアにおけるPTSDが蘇ってきました。人間とサーバーの戦いは時に激しいものであり、これはまさに痛ましい物語です。

私たちが常に説いていることの一つは透明性です。今回のケースでは、 @jar がコミュニティに何が起こっているかを正確に伝えているのは素晴らしいことです。素晴らしい!

今日MXrouteに加入する?もちろん。避けられない問題を解決するためにここまで努力するプロバイダーは、利用する価値がある。確認してみたところ、ブラックフライデーのセールはまだ開催中だった。

小さい
10GBのストレージ
無制限のドメイン
無制限のメールアカウント
1時間あたり300件の送信(メールアカウントごと)
15ドル / 3年
[注文]

中くらい
25GBのストレージ
無制限のドメイン
無制限のメールアカウント
1時間あたり300件の送信(メールアカウントごと)
30ドル / 3年
[注文]

大きい
50GBのストレージ
無制限のドメイン
無制限のメールアカウント
1時間あたり300件の送信(メールアカウントごと)
年間34.50ドル
69ドル / 2年間
99ドル / 3年間
[注文]

おすすめの記事